OpenAI'ın o3 Modelinin İnsan Seviyesinde Zekaya Sahip Olduğu İddia Ediliyor, Ancak Gerçekler Farklı Olabilir

OpenAI, geçtiğimiz ay tanıttığı o3 serisi yapay zeka modelleri ile dikkatleri üzerine çekti. ARC-AGI (Abstract Reasoning Corpus – Artificial General Intelligence) testinde %85’lik bir skor elde eden model, önceki en yüksek skoru %30’luk bir farkla geçti. Bu başarı, o3’ün insan seviyesinde bir zekaya sahip olabileceği iddialarını da beraberinde getirdi. Ancak, bu iddiaların doğruluğu konusunda hala netlik yok.

OpenAI’nin ARC-AGI Testindeki Başarısı

ARC-AGI testi, desen tanıma, mantık yürütme ve mekansal anlayış gibi soyut zekayı ölçen sorular içeriyor.

o3 modeli, %85 skorla testi tamamladı.
Bu skor, testte ortalama bir insanın performansına eşdeğer.
Önceki en yüksek skor olan %55’in oldukça üzerinde.

Ancak bu sonuç, modelin insan seviyesinde bir zekaya sahip olduğu anlamına mı geliyor? Bu soruya yanıt verebilmek için modelin mimarisine, eğitim yöntemlerine ve kullanılan veri setlerine dair daha fazla bilgiye ihtiyaç var.

o3 Modelinin Teknik Yapısı Hakkında Bilinmeyenler

OpenAI, o3 modelinin yapısına dair herhangi bir detay paylaşmadı. Ancak şirketin önceki modellerine dayalı bazı tahminlerde bulunmak mümkün:

Test-Time Compute Tekniği: o1 serisinde kullanılan bu yöntem, modelin bir soruya daha fazla zaman ayırmasını ve hatalarını düzeltmesini sağlıyordu.
GPT-4o İyileştirmesi: o3 modelinin de benzer şekilde, temel mimaride büyük değişiklikler olmaksızın, iyileştirilmiş bir sürüm olması muhtemel.
AGI’ye Ulaşılmadı: AGI seviyesine ulaşılması durumunda, OpenAI’nin Microsoft ile olan ortaklığı sona erecekti. Bu da, modelin AGI seviyesine henüz ulaşmadığını gösteriyor.

ARC-AGI Testindeki Başarının Anlamı

o3 modelinin ARC-AGI testindeki başarısı, mantık yürütme ve desen tanıma yeteneklerinin geliştirildiğini gösteriyor. Ancak bu, modelin genel zekasında bir artış olduğu anlamına gelmiyor.

Desen Tanıma: Model, yüksek kaliteli veri setleri ve yeni algoritmalarla testte üstün performans göstermiş olabilir.
Sınırlı İyileştirme: Bu başarının izole bir alanda elde edildiği ve modelin diğer yeteneklerine yansımadığı muhtemel.

AGI Henüz Uzak Bir Hedef

AGI seviyesine ulaşılması, yapay zekanın insan seviyesindeki zekayı aşması ve geniş bir görev yelpazesini öğrenebilmesi anlamına gelir. Ancak:

Geoffrey Hinton gibi uzmanlar, AGI’ye ulaşmanın yıllar alacağını öngörüyor.
OpenAI’nin böyle bir başarıyı açıkça duyurması beklenirdi; dolayısıyla, o3’ün AGI seviyesine ulaştığını iddia etmek gerçekçi değil.

Sonuç: İzole Edilmiş Bir Başarı

OpenAI’nin o3 modeli, soyut mantık yürütme yeteneklerinde önemli iyileştirmeler sunuyor. Ancak bu, modelin genel zekasını insan seviyesine çıkardığı anlamına gelmiyor. AGI’ye giden yol hâlâ uzun ve karmaşık.