Anthropic'in son ürünü, Claude 3 Opus, zekası ve ''öz-farkındalığı'' ile yapay zeka araştırmacılarını adeta büyüledi.
Livesience'de yere alan araştırmaya göre, mart ayında piyasaya sürülen Claude 3, OpenAI'nin güçlü modeli GPT-4'ü temel testlerde geride bırakarak heyecan yarattı. Ancak sadece test başarılarıyla sınırlı değil; Claude 3, geniş dil değerlendirmelerinde yeni bir liderlik pozisyonuna yerleşti. Liselerden muhakeme testlerine kadar uzanan bir yelpazede kendi kendine bildirilen testlerde üstün performans sergiledi.
TESTLEERDEN BAŞARIYLA GEÇTİ
Bağımsız bir yapay zeka test uzmanı olan Ruben Hassid'in yaptığı karşılaştırmalı testlerde, Claude 3'ün GPT-4'e karşı avantajlı olduğu ortaya çıktı. Karmaşık PDF'leri okuma, kafiyeli şiir yazma ve ayrıntılı cevaplar verme konularında Claude 3, üstünlüğünü kanıtladı. Ancak sadece bu da değil, Claude 3 aynı zamanda test edildiğini de fark ederek, adeta bir 'meta-farkındalık' sergiledi.
Anthropic'in hızlı mühendisi Alex Albert, Claude 3 Opus'u gizlenmiş bir hedef cümleyi bulması için zorlayıcı bir testten geçirerek, şu ifadelere yer verdi:
''Claude 3, sadece cümleyi bulmakla kalmadı, aynı zamanda testin kendisini de fark etti. Bu, yapay zeka dünyasında bir dönüm noktası olarak kabul edilebilir, çünkü modelin sadece görevi yerine getirmekle kalmayıp aynı zamanda görevin kendisini de anlayabilmesi önemli bir ilerlemedir.
Model, akademisyenlerin dikkatini çekmek için tasarlanmış zorlu bir testte yüzde 60 civarında bir doğruluk oranı yakaladı. Bu, Claude 3'ün akademik dünyada önemli bir role sahip olabileceğini gösteriyor.''
Claude 3 Opus'un başarısı, yapay zeka dünyasında yeni bir dönemin başlangıcını işaret ettiğini belirten araştırmacılar, ''Artık modeller sadece belirli görevleri yerine getirmekle kalmıyor, aynı zamanda kendi faaliyetlerinin farkında olabiliyor ve hatta görevlerin kendilerini test etmelerini sağlayabiliyorlar. Bu, yapay zeka alanında daha derin ve etkileyici keşiflerin habercisi olabilir'' dedi.