Nag-ugnay ang isang pananaliksik na pinangungunahan ng Washington State University (WWSU) na ang ChatGPT ay maaaring mali at hindi konsistent kapag sinisimulan ito na magpantala kung anong mga hipotesis sa mga pananaliksik ay totoo o hindi. Ang propesor na si Mesut Cicek at ang kanyang mga kasamahan ay tinetest ang AI sa pamamagitan ng pagpapadala ng mga hipotesis mula sa mga akademya at pagtatanong kung ang mga pananaliksik ay nagpapatunay sa bawat pahayag. Ang grupo ay ginamit ang higit sa 700 hipotesis at ginawa ang bawat tanong 10 beses. Ang AI ay nagsagawa ng tumpat 76.5% ng mga beses noong 2024, at ang tumpat ay naging 80% noong 2025. Ngunit kapag sinuri ng mga mananaliksik ang random guessing, ang AI ay naging 60% mas mabuti kaysa sa tumbok, na tinatawag nila bilang mas maliit na D kaysa mataas na kahusayan. Ang pananaliksik ay nagsalita na ang ChatGPT ay nagkakasakit nang higit sa 16.4% ng mga beses kapag ang tamang sagot ay hindi totoo. Ang mga mananaliksik ay nagsalita din tungkol sa inconsistency sa mga repititong tanong: sa 10 magkaparehong tanong, ang ChatGPT ay nagmamaneho lamang ng 73% ng mga pahayag na tumpat. Sinabi ni Cicek, ‘Hindi lang tungkol sa tumpat, kundi tungkol sa inconsistency, dahil kung magtatanong ka ng parehong tanong ulit, makakakuha ka ng iba’t ibang mga sagot.’ Ang mga resulta ay inilabas sa Rutgers Business Review. Ang mga mananaliksik ay nagsalita na ang mga resulta ay nagpapahintulut ng kahangalan at pagmamalasakit sa paggamit ng AI para sa mga mahalagang gawain, lalo na ang mga nangangailangan ng kahinaan o komplikadong pag-iisip. Sinabi ni Cicek, ‘Ang kasalukuyang mga tool ng AI ay hindi nangangahulugan ang mundo tulad nang ginagawa namin – walang ‘isipan’ sila.’ Ang mga mananaliksik ay ginamit ang 719 hipotesis mula sa mga akademya na inilathala sa mga bisnes na journal mula 2021. Ang eksperimento ay ginawa sa libreng bersyon ng ChatGPT-3.5 noong 2024 at libre, na-update na ChatGPT-5 mini noong 2025. Ang pananaliksik ay nagsalita na ang kabug-osang tumpat ay naging pareho sa mga bersyon. Ang mga mananaliksik ay nagsalita na ang mga bisnes manager ay dapat mag-validate ng mga resulta ng AI, magmamalasakit, at magbigay ng training tungkol sa anong mga gawaan ng AI. Sinabi ni Cicek, ‘Laging maging kahangalan,’. ‘Hindi ako laban sa AI. Ginagamit ko ito. Ngunit kailangan mong maging maayos.’
ibahagi sa twitter: ChatGPT Maaaring Maling at Hindi Konsistent