
Yapay zekâ alanında önemli bir gelişme yaşandı: OpenAI’nin GPT-4.5 modeli, ünlü Turing Testi’ni başarıyla geçti. Bu test, bir makinenin insan benzeri zekâya sahip olup olmadığını değerlendirmek için kullanılıyor.
Kaliforniya Üniversitesi San Diego Dil ve Biliş Laboratuvarı’ndan araştırmacılar tarafından yapılan çalışmada, katılımcılar aynı anda hem bir insanla hem de bir yapay zekâ modeliyle sohbet etti. Hangisinin insan olduğunu belirlemeye çalıştılar. Sonuçlar GPT-4.5’in “persona” (kişilik) talimatlarıyla yönlendirildiğinde, katılımcıların %73’ünün onu insan zannettiğini gösterdi. Bu oran rastgele tahminin %50 olduğu düşünüldüğünde, oldukça yüksek bir başarıya işaret ediyor.
Araştırmada ayrıca Meta’nın LLama 3.1-405B modeli, OpenAI’nin GPT-4o modeli ve 1960’larda geliştirilen ELIZA adlı erken dönem bir chatbot da değerlendirildi. Özellikle, GPT-4.5 ve LLama modellerinin “persona” talimatlarıyla yönlendirildiğinde, katılımcıların insanı yapay zekâdan ayırt etme konusunda rastgele tahminden daha iyi performans gösteremediği belirtildi.
Turing Testi, 1950 yılında İngiliz matematikçi ve bilgisayar bilimci Alan Turing tarafından ortaya konuldu. Testin temelinde, bir makinenin metin tabanlı bir sohbet sırasında insan gibi davranıp davranamayacağını değerlendirmek yatıyor. Eğer bir insan sorgulayıcı, makineyi insandan ayırt edemezse, makinenin insan benzeri zekâya sahip olduğu kabul ediliyor.
Bu son çalışmada, araştırmacılar çevrimiçi bir platformda deneyler gerçekleştirdi. Yaklaşık 300 katılımcı, sekiz tur boyunca rastgele olarak ya sorgulayıcı ya da sorgulanan rollerine atandı. Sorgulananlardan biri insan, diğeri ise bir chatbot idi. GPT-4.5 modeli, “persona” talimatları olmadan %36’lık bir başarı oranı yakalarken, “persona” talimatlarıyla bu oran %73’e yükseldi. GPT-4o modeli ise sadece %21’lik bir başarı oranına sahipti.
Ancak bu sonuçlar yapay zekâ modellerinin gerçekten insan gibi düşündüğü anlamına gelmiyor. Google’da yazılım mühendisi olarak çalışan François Chollet, Turing Testi’nin daha çok bir düşünce deneyi olduğunu ve makinenin gerçekten insan gibi düşündüğünü kanıtlamadığının altını çiziyor.
Araştırmanın baş yazarı Cameron Jones da, bu sonuçların yapay zekâ modellerinin insan zekâsına sahip olduğunu kesin olarak göstermediğini ifade ediyor. Jones, bu tür modellerin kısa etkileşimlerde insanları kandırabilecek seviyeye geldiğini ve bunun iş gücü otomasyonu, sosyal mühendislik saldırıları ve toplumsal değişimler gibi potansiyel sonuçları olabileceğini vurguluyor.
Sonuç olarak, yapay zekâ modellerinin Turing Testi’nde gösterdiği bu başarı, teknolojinin insan benzeri etkileşimler kurma yeteneğinin arttığını gösteriyor. Ancak bu durumun toplumsal ve etik sonuçları üzerine daha fazla araştırma ve tartışma yapılması gerektiği açık.
Sitedeki diğer ‘Kimdir Nedir?’ yazılarını okumak için tıklayınız: Kimdir Nedir?