- 17:04Google Yazılım Geliştiricileri İçin Yeni Bir Araç Başlattı
- 16:21Trump: Pentagon ve FBI, İran Saldırılarına İlişkin Sızdırılan Raporları Araştırıyor
- 15:25Suudi heyeti Kuzey Afrika'da stratejik yatırım turu başlattı
- 12:50Trump, Netanyahu yolsuzluk davası sırasında İsrail savcılarını eleştirdi
- 12:29Suriye, El-Şara'ya Yönelik Suikast Girişiminin Engellendiğine Dair Haberleri Yalanladı
- 11:53ABD-Afrika İş Zirvesi: Afrika Yeni Küresel Ekonomide Önemli Bir Oyuncu
- 11:15Brezilya: Belém, "Aşırı" Konaklama Maliyetleri Eleştirilerine Rağmen COP30'a Ev Sahipliği Yapacak
- 10:30Fas, Dakar'da Enerji Diplomasisini Konuşlandırıyor
- 09:15Fas ve Rusya Sivil Havacılık ve Karayolu Taşımacılığı Bağlarını Genişletmeyi Tartışıyor
Facebook’ta Bizi Takip Edin
Yaşlanan sohbet robotları tıpkı insanlar gibi demans belirtileri gösteriyor!
Yeni bir çalışma, bazı önde gelen AI sohbet robotlarının hafif bilişsel bozulmanın açık işaretlerini gösterdiğini gösteriyor.
İnsanlarda olduğu gibi, sohbet robotları yaşlandıkça etkiler daha belirgin hale geliyor; daha eski, daha büyük dil modelleri daha az iyi performans gösteriyor.
Çalışma "The BMJ" dergisinde yayınlandı ve "Futurism" web sitesinden alınan bir rapora göre teknolojinin tıp alanında, özellikle teşhiste kullanılacak kadar etkili olmadığını açıklığa kavuşturmayı amaçlıyor.
Araştırmanın arkasındaki araştırmacılar, bulguların "yapay zekanın yakında insan doktorların yerini alacağı hipotezini" sorguladığını, çünkü önde gelen sohbet robotlarının belirgin bilişsel zayıflıklarının tıbbi teşhis güvenilirliğini etkileyebileceğini söyledi.
Bu çalışmada test edilen sohbet robotları OpenAI'den "GPT-4" ve "GPT-4o", Anthropic'ten "Claude 3.5 Sonnet" ve Google'dan "Gemini 1.0" ve "Gemini 1.5" idi.
Bu sohbet robotları, yüksek puanların daha fazla bilişsel yeteneği gösterdiği demansın erken belirtilerini tespit etmek için tasarlanmış bir test olan Montreal Bilişsel Değerlendirme (MoCA) için kullanıldı.
En yüksek puanı “GPT-4o” alırken (30 üzerinden 26 puan, bu neredeyse normalin alt sınırı), en düşük puanı ise “Gemini” robotları aldı (30 üzerinden 16 puan).
Tüm chatbotlar çoğu görev türünde başarılı olmasına rağmen, her biri dairesel sayılar arasında artan sırada bir çizgi çizmek gibi görsel-uzaysal ve idari görevlerde zayıf performans gösterdi.
Ayrıca kesin zamanı gösteren bir saat çizmenin yapay zeka için oldukça zor olduğu da ortaya konuldu. Gemini modelleri, beş kelimelik bir diziyi ezberlemeyi içeren oldukça basit, gecikmeli hatırlama görevinde tamamen başarısız oldu.
Yorumlar (0)