Amazon yeni üretken yapay zeka (GenAI) ses modeli Nova Sonic’i tanıttı. Nova Sonic, sesi yerel olarak işleyebiliyor ve kulağa doğal gelen konuşmalar üretebiliyor. Amazon Nova Sonic için birleşik bir model mimarisi kullandı. Nova Sonic OpenAI’nin GPT 4.0 modeli ile rekabet edecek seviyede ve yaklaşık yüzde 80 daha ucuz.
Amazon, doğal konuşmaları işleyip hızla yazıya dökebilen ve insan konuşmasına yüksek kalitede benzer konuşma yetenekleri gösteren yeni üretken yapay zeka (GenAI) ses modeli Nova Sonic’i geliştirdi. Nova Sonic, Amazon’un sesli asistanı Alexa+‘nın performansını artırmak için tasarlandı. Nova Sonic’in performansının hız, konuşma tanıma ve konuşma kalitesini ölçen kıyaslamalarda OpenAI ve Google‘ın öncü ses modelleriyle rekabet edecek seviyede olduğu belirtiliyor. Nova Sonic, ortalama yanıt süresi 1,09 saniye ile Amazon’un önceki sesli yapay zekalarına göre çok daha hızlı yanıt verebiliyor.
Farklı Aksanlardaki Konuşmaları Tanıyor, Kalabalık Ortamlarda Birden Fazla Konuşmacıyı Ayırt Edebiliyor
Amazon’un açıklamasına göre Nova Sonic, diller ve lehçeler arasında konuşma tanımayı ölçen bir kriter olan Çok Dilli LibriSpeech’te, İngilizce, Fransızca, İtalyanca, Almanca ve İspanyolca’da ortalama olarak yalnızca yüzde 4,2’lik bir kelime hata oranı (WER) elde etti. Nova Sonic, Artırılmış Çok Taraflı Etkileşimde OpenAI’ın GPT-4o-transcribe modeline kıyasla kelime hata oranı açısından yüzde 46,7 daha doğru.
Amazon Yapay Genel Zeka Kıdemli Başkan Yardımcısı Rohit Prasad, Amazon’un ses destekli teknoloji aracılığıyla müşteri deneyimlerini iyileştirme taahhüdünü vurguladı. Prasad “Nova Sonic, birden fazla işlevi tek bir modelde birleştirerek, daha doğru, doğal ve ilgi çekici müşteri etkileşimleri sağlıyor. Nova Sonic kapsamlı testlerden geçmiş ve yüksek kaliteli, insana benzer konuşma yetenekleri göstermiştir. Doğal diyalog işleme ve konuşma tanıma doğruluğunda güçlü performans sergilemiştir.” açıklamasını yaptı.
Amazon, sesin ötesine geçerek görüntü ve fiziksel dünyadan alınan verileri işleyebilen daha gelişmiş yapay zeka modelleri üzerinde çalışmalar yürüttüğünü de açıkladı.
Nova Sonic’e Nereden Ulaşılabilir?
Nova Sonic, Amazon’un kurumsal yapay zeka uygulamaları geliştirmeye yönelik geliştirici platformu Bedrock üzerinden, yeni bir çift yönlü akış API’si aracılığıyla kullanılabilir.