DeepSeek, ChatGPT Karşısında Ezberleri Bozuyor

Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD’li OpenAI firmasının ChatGPT’sinin en büyük rakiplerinden biri haline geliyor. 20 Ocak’ta duyurduğu açık kaynaklı model DeepSeek-R1 “Yapay Zeka’nın Sputnik anı” olarak adlandırılıyor.

Bu ay yayınlanan DeepSeek hem son derece hızlı hem de az maliyetle geliştirildi.
Çinli teknoloji laboratuvarı, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı diğer modelini de yayınladı. Bu model de OpenAI’ın yakın zamanda piyasaya sürdüğü o1 ile rekabet halinde.

DeepSeek, AI Endüstrisi için Stratejik Avantajıyla Meydan Okuyor

Çin’in gelişmiş çipleri tedarik etme becerisi üzerindeki sıkı ABD ihracat kontrollerine rağmen DeepSeek’in R1 AI modelini piyasaya sürmesi, henüz yeni gelişmekte olan AI endüstrisi için büyük fonlar vaat ederek stratejik avantajını zorladığını gösteriyor. ChatGPT’nin eğitim verilerini işlemek için 10.000 Nvidia GPU’ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor. DeepSeek’in çözümünün son derece verimli olması ve batılı muadillerinin benzer tekliflerinin yaklaşık 1/50’si kadar eğitim maliyeti gerektirmesi Silikon Vadisi’ni şaşkınlığa uğrattı.

DeepSeek Nedir?

DeepSeek, kendisine yöneltilen her şeye kişiselleştirilmiş, bağlamsal olarak yerinde yanıtlar vermek üzere tasarlanmış, son teknoloji bir dil modelidir.

DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. İsteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM’i kişiselleştirebiliyor. Eğitim verileri ise patentli.

R1’in Sırrı Nedir?
Emory Üniversitesi’nde bilgi sistemleri alanında öğretim ütesi Hancheng Cao, MIT Technology Review dergisine verdiği röportajda, “Bu, özellikle Küresel Güney’deki sınırlı kaynaklara sahip araştırmacılar ve geliştiriciler için harika bir eşitleyici atılım olabilir,” diyor.

ABD’nin kendi Stargate projesini duyurmasının ardından gelen DeepSeek-R1 duyurusu, yapay zeka alanında Çin’in ABD’ye meydan okuması olarak değerlendirilebilir. Çin Merkez Bankası, önümüzdeki beş yıl içerisinde yapay zeka endüstrisi zincirindeki çeşitli kuruluşlara toplamda en az 1 trilyon yuan tutarında özel kapsamlı finansal destek sağlamayı planlıyor. Finansmanın amacı, Çin’in yapay zeka alanındaki öz yeterliliğini güçlendirmek, yapay zekayla ilgili altyapıyı (veri merkezlerini) iyileştirmek ve “inovasyonu artırmak”.

Programın ardındaki deha: Liang Wenfeng
Çin’in Hangzhou kentindeki şirket, Temmuz 2023’te bilgi ve elektronik mühendisliği geçmişine sahip Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından kuruldu. Liang’ın 2015’te kurduğu bir fon olan High-Flyer’ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen “yapay genel zeka” seviyesine ulaşmayı hedefliyor.