Стэнфордын Их сургуулиас хиймэл оюун ухаан бүхий чатбот ChatGPT-4, ChatGPT-3.5 хувилбаруудын гүйцэтгэлийг харьцуулсан судалгаа хийжээ.
Судалгааны хүрээнд тэд OpenAI компанийн ChatGPT-4, ChatGPT-3.5 чатботуудад 4 төрлийн даалгавар өгсөн байна. Даалгаварт тоо бодох, асуултад хариулах, программ хангамжийн код үүсгэх, дүрслэл гаргах зэрэг багтжээ.
Тийнхүү судалгааны явцад хамгийн анхаарал татсан зүйл нь хоёр хувилбарын тоо бодох чадамж байсан гэнэ. Тодруулбал, өнгөрөгч гуравдугаар сард ChatGPT-4 чатбот 17077 гэх тоог анхны тоо болохыг нийт асуулгын 97.6 хувьд зөв тооцож байсан бол зургаадугаар сард нийт асуулгын ердөө 2.4 хувьд л зөв тооцсон байна. Харин ChatGPT-3.5 чатбот гуравдугаар сард тус асуултад нийт асуулгын 7.4 хувьд зөв хариулж байсан бол зургаадугаар сард нийт асуулгын 86.8 хувьд зөв хариулжээ.
Үүнээс гарсан дүгнэлтээр чатбот шинэчлэгдэх бүрдээ аль нэг хэсэгтээ өмнөх хувилбараас арай өөрчлөгддөг гэсэн байна. Учир нь чатботыг ашиглаж буй хэл хэт өргөн цар хүрээтэй тул сайжруулах явцад тооцоолоогүй үр дүн гарах боломж тун өндөр гэжээ.
Эх сурвалж: Fortune