OpenAI Çok Modlu Yapay Zeka Asistanını Piyasaya Sürebilir

OpenAI, bazı müşterilerine hem konuşabilen hem de nesneleri tanıyabilen yeni bir çok modlu yapay zeka modeli gösteriyor. Deneyimleme fırsatına sahip kaynaklar, bunun şirketin Pazartesi günü göstermeyi planladığı şeyin bir parçası olabileceğini söylüyor.

Yeni modelin, altyazı ve ses modellerinin yapabildiğinden daha hızlı bir şekilde daha doğru görüntü ve ses yorumlaması sunduğu bildiriliyor. The Information, bu modelin müşteri hizmetleri temsilcilerinin arayanların ses tonlamalarını ya da alaycı olup olmadıklarını daha iyi anlamalarına yardımcı olabileceğini ve “teorik olarak” modelin öğrencilere matematik konusunda yardımcı olabileceğini ya da gerçek dünyadaki işaretleri tercüme edebileceğini yazıyor.

Kaynaklar, modelin “bazı soru türlerini yanıtlama” konusunda GPT-4 Turbo’yu geride bırakabildiğini, ancak yine de bazı şeyleri kendinden emin bir şekilde yanlış yapmaya yatkın olduğunu söylüyor.

OpenAI seems to be working on having phone calls inside of chatGPT. This is probably going to be a small part of the event announced on Monday.
(1/n) pic.twitter.com/KT8Hb54DwA
— Ananay (@ananayarora) May 11, 2024

Geliştirici Ananay Arora’ya göre, OpenAI’nin telefon görüşmeleri yapmak için yeni bir yerleşik ChatGPT özelliği yaratması da mümkün. Arora ayrıca OpenAI’ın gerçek zamanlı ses ve video iletişimi için sunucular hazırladığını söyledi.

Eğer önümüzdeki hafta bir şey tanıtılacaksa, bunların hiçbiri GPT-5 olmayacak diyebiliriz. CEO Sam Altman, yaklaşmakta olan duyurunun, GPT-5 olması beklenen modelle bir ilgisi olduğunu açıkça reddetti. Bilgiler GPT-5’in yıl sonuna kadar kamuoyuna açıklanabileceğini yazıyor.

Kaynak: www.theverge.com