Grok-2 Ailesi Beta Sürümde: Yeni AI Modelleri GPT-4 Turbo'yu Geride Bırakıyor

Elon Musk’a ait yapay zeka firması xAI, Grok-2 ailesi AI modellerini beta sürümde yayınladı. Grok-2 ve Grok-2 Mini modelleri Salı günü tanıtıldı ve büyük dil modellerinde (LLM) yeni yetenekler ve iyileştirmeler sundu. Her iki model de Premium ve Premium+ X kullanıcılarına sunuldu. İlginç bir şekilde, Grok-2 modelleri görsel üretim yeteneklerine sahip, ancak bu özellik üçüncü taraf bir AI modeli tarafından destekleniyor. Şirket, Grok-2’nin benchmark testlerinde GPT-4 Turbo’yu geride bıraktığını iddia ediyor.

Grok-2 AI Modelleri Beta Sürümünde Yayınlandı

xAI, bir blog yazısında iki yeni Grok AI modelinin lansmanını duyurdu ve şunları söyledi: “Grok-2’yi, önceki modelimiz Grok-1.5’ten önemli bir adım ileriye taşıyan, sohbet, kodlama ve mantık yürütme konularında öncü yeteneklere sahip erken bir önizleme olarak yayınlamaktan heyecan duyuyoruz. Aynı zamanda Grok-2 Mini’yi, Grok-2’nin daha küçük ama yetenekli bir kardeşi olarak tanıtıyoruz.”

Grok-2, en ileri düzey (SOTA) bir AI modeli iken, Grok-2 Mini, Grok-2’den türetilmiş daha küçük bir dil modeli olup, daha hızlı ve daha kesin yanıtlar üretebiliyor. Her iki model de Grok sohbet botunda X Premium ve X Premium+ kullanıcılarına sunuldu. Kullanıcıların, yeni AI modellerine erişim sağlamak için uygulamanın en son sürümüne güncelleme yapmaları gerekecek.

Şirket, Grok modelinin erken bir versiyonunun, Büyük Model Sistemleri Organizasyonu (LMSYS) liderlik tablosunda “sus-column-r” adı altında test edildiğini ve Claude 2.5 Sonnet ve GPT-4 Turbo’yu geride bırakmayı başardığını belirtti.

LMSYS’nin resmi X hesabı da bunu doğruladı ve Grok-2’nin kodlama ve matematikte yüksek performans sergilediğini, bu alanlarda ikinci sırada yer aldığını ve zorlayıcı prompt’larda dördüncü sırada yer aldığını vurguladı. Şu anda AI modelleri hakkında başka teknik bilgi, veritabanı veya mimari hakkında bilgi mevcut değil.

Buna ek olarak, xAI, Grok AI arayüzünü yeniden tasarladığını ve yeni özellikler eklediğini açıkladı. Bunlar arasında görsel üretim yetenekleri de bulunuyor. Ancak bu yetenek, Black Forest Labs tarafından oluşturulan Flux.1 modeli tarafından sağlanıyor. TechCrunch’ın bir raporu, görsel üretim modelinin güvenlik önlemleri bulunmadığını ve politikacıların görüntülerini oluşturabildiğini iddia ediyor.