Nisan ayında Meta, AI endüstrisi için bir ilk olacağını duyurdu: en iyi özel modellerle eşleşen performansa sahip açık kaynak bir model üzerinde çalışıyordu. Bugün, o model karşınızda: Meta, şimdiye kadarki en büyük açık kaynak AI modeli Llama 3.1’i piyasaya sürüyor. Şirket, bu modelin GPT-4o ve Anthropic’in Claude 3.5 Sonnet’ini çeşitli ölçütlerde geride bıraktığını iddia ediyor.
Llama 3.1, birkaç ay önce çıkan daha küçük Llama 3 modellerine kıyasla çok daha karmaşık. En büyük versiyon 405 milyar parametreye sahip ve 16.000’den fazla NVIDIA H100 GPU kullanılarak eğitildi. Meta, Llama 3.1’in geliştirme maliyetini açıklamıyor ancak sadece NVIDIA çiplerinin maliyeti bile yüz milyonlarca dolara ulaşıyor.
Meta, Llama 3.1’i ücretsiz olarak sunmasının nedenini, açık kaynaklı AI modellerinin hızla gelişmesi olarak açıklıyor.
Meta, Llama 3.1’in yayılmasını hızlandırmak için Microsoft, Amazon, Google, NVIDIA ve Databricks gibi şirketlerle iş birliği yapıyor. Şirket, Llama 3.1’in üretimde çalıştırma maliyetinin OpenAI’nin GPT-4o modelinin yarısı kadar olduğunu belirtiyor. Model ağırlıklarını yayınlayarak şirketlerin kendi verileriyle eğitmelerine ve istedikleri gibi ayarlamalarına olanak tanıyor.
Meta, Llama 3.1’i eğitmek için kullanılan verileri paylaşmıyor, ancak 405 milyar parametreli versiyonu iyileştirmek için sentetik veri kullandığını belirtiyor. Meta’nın Üretken AI Başkan Yardımcısı Ahmad Al-Dahle, Llama 3.1’in geliştiriciler arasında popüler olacağını ve daha küçük modeller için bir öğretmen olarak kullanılacağını öngörüyor.
Meta’nın kendi uygulaması olan Llama, ChatGPT gibi genel amaçlı bir sohbet botu olarak konumlandırılıyor ve Instagram, Facebook ve WhatsApp’ın her yerinde bulunabiliyor. Llama 3.1, WhatsApp ve Meta AI web sitesinde ABD’de kullanılabilir olacak. Ardından Instagram ve Facebook’a da gelecek. Ayrıca, Fransızca, Almanca, Hintçe, İtalyanca ve İspanyolca gibi yeni dilleri destekleyecek şekilde güncelleniyor.