Google, yapay zeka tarafındaki yeni nesil üretim modelini resmi olarak duyurdu. Şirketin tanıttığı yeni sistemin adı:
- Gemini Omni
olarak açıklandı.
Google’ın verdiği bilgilere göre Gemini Omni, yalnızca metin değil:
- video
- görsel
- ses
- görüntü
- konuşma
gibi farklı veri türlerini aynı anda anlayıp işleyebiliyor.
Şirket özellikle yeni modelin video üretimi ve video düzenleme tarafında büyük değişim yaratacağını söylüyor.
Gemini Omni’nin ilk sürümü olan:
- Gemini Omni Flash
şimdiden bazı Google servislerinde kullanıma açılmış durumda.
Gemini Omni Nedir?
Google’ın açıklamasına göre Gemini Omni, şirketin şimdiye kadar geliştirdiği en gelişmiş çoklu modalite yapay zeka sistemlerinden biri.
Buradaki temel amaç, farklı içerik türlerini aynı anda anlayabilen ve bunlardan yeni içerikler üretebilen tek bir sistem oluşturmak.
Yani kullanıcılar artık:
- metin
- ses
- video
- fotoğraf
gibi içerikleri bir arada kullanarak yeni videolar oluşturabilecek.
Google bunu:
- “Gemini’nin düşünme yeteneği ile üretim gücünün birleşmesi”
olarak tanımlıyor.
Video Düzenleme Konuşarak Yapılabilecek
Gemini Omni’nin en dikkat çekici özelliklerinden biri doğal dil ile video düzenleme desteği oldu.
Kullanıcılar sisteme normal şekilde konuşarak komut verebiliyor.
Örneğin:
- sahneyi değiştir
- karakter ekle
- hava durumunu değiştir
- kamerayı farklı açıya al
gibi istekler yazılabiliyor.
Google’ın açıklamasına göre sistem yapılan her düzenlemeyi önceki komutlarla bağlantılı şekilde sürdürüyor.
Bu sayede:
- karakter tutarlılığı
- sahne düzeni
- fizik kuralları
korunabiliyor.
Şirket özellikle bu noktayı vurguluyor çünkü mevcut birçok AI video sistemi uzun düzenleme zincirlerinde tutarlılığı korumakta zorlanıyor.
Gerçek Dünya Bilgilerini Kullanabiliyor
Google’a göre Gemini Omni yalnızca görüntü üretmiyor.
Model aynı zamanda:
- fizik
- tarih
- bilim
- kültürel bağlam
gibi konulardaki bilgileri de kullanabiliyor.
Bu sayede oluşturulan videoların daha mantıklı ve gerçekçi olması hedefleniyor.
Örneğin sistem:
- yer çekimi
- hareket fiziği
- sıvı davranışı
- kinetik enerji
gibi fiziksel süreçleri daha doğru şekilde simüle edebiliyor.
Google bu gelişmenin özellikle gerçekçi video üretimi açısından önemli olduğunu belirtiyor.
Tek Bir Girdi Türüyle Sınırlı Değil
Gemini Omni’nin en önemli farklarından biri farklı içerik türlerini aynı projede birleştirebilmesi.
Kullanıcılar sisteme:
- görsel
- ses kaydı
- video
- yazılı komut
gibi farklı içerikler verebiliyor.
Sistem bunların tamamını tek bir video üretim sürecinde kullanabiliyor.
Başlangıç aşamasında ses tarafında yalnızca ses referansı desteği bulunuyor.
Ancak Google ilerleyen süreçte farklı ses girişlerini de destekleyeceğini söylüyor.
Kendi Dijital Avatarınızı Oluşturabileceksiniz
Google’ın tanıttığı yeni özelliklerden biri de:
- Avatar sistemi
oldu.
Bu özellik sayesinde kullanıcılar kendi dijital versiyonlarını oluşturabilecek.
Yani sistem:
- yüzünüzü
- sesinizi
- konuşma tarzınızı
taklit eden dijital karakterler hazırlayabiliyor.
Ardından bu avatarlarla yeni videolar üretilebiliyor.
Google şu an için özellikle ses değiştirme ve tam konuşma düzenleme tarafında hâlâ test sürecinin devam ettiğini söylüyor.
Şirket bu teknolojilerin güvenli şekilde kullanılması için ek çalışmalar yaptığını belirtiyor.
Tüm Videolarda Dijital Filigran Bulunacak
Google, yapay zeka ile üretilen içeriklerde güvenlik ve şeffaflık konusuna da değiniyor.
Şirketin açıklamasına göre Gemini Omni ile oluşturulan tüm videolarda:
- SynthID dijital filigranı
yer alacak.
Bu filigran kullanıcı tarafından doğrudan görülmüyor ancak içeriklerin AI üretimi olduğunu doğrulayabiliyor.
Google ayrıca kullanıcıların içeriklerin yapay zeka ile oluşturulup oluşturulmadığını:
- Gemini uygulaması
- Chrome içindeki Gemini sistemi
- Google Arama
üzerinden kontrol edebileceğini söylüyor.
Son dönemde AI videolarının gerçek görüntülerden ayırt edilmesinin zorlaşması nedeniyle bu tarz doğrulama sistemleri önem kazanmaya başladı.
İlk Model Gemini Omni Flash Oldu
Google bugün Omni ailesinin ilk modeli olan:
- Gemini Omni Flash
sürümünü yayınladı.
Bu model şu anda:
- Gemini uygulaması
- Google Flow
- YouTube Shorts
içinde kullanılabiliyor.
Şirket ayrıca YouTube Shorts ve YouTube Create kullanıcılarının sistemi ücretsiz şekilde kullanabileceğini açıkladı.
Gemini Omni Flash şu an:
- Google AI Plus
- Google AI Pro
- Google AI Ultra
abonelerine global olarak sunuluyor.
Video Üretim Yarışı Daha da Kızışıyor
Son dönemde teknoloji şirketleri arasında AI video üretim yarışı ciddi şekilde hızlandı.
Özellikle:
- OpenAI
- Adobe
- Runway
- Meta
gibi şirketler yeni nesil video sistemleri üzerinde çalışıyor.
Gemini Omni’nin fark yarattığı nokta ise çoklu içerik girişine daha yoğun odaklanması gibi görünüyor.
Google özellikle:
- doğal konuşma ile düzenleme
- uzun sahne tutarlılığı
- fizik motoru benzeri davranışlar
üzerinde duruyor.
YouTube İçerik Üreticileri İçin Büyük Etki Yaratabilir
Gemini Omni’nin özellikle içerik üreticileri üzerinde büyük etkisi olabilir.
Çünkü sistem sayesinde kullanıcılar:
- kısa video içerikleri
- AI destekli montajlar
- sosyal medya klipleri
- efektli sahneler
çok daha hızlı şekilde hazırlayabilecek.
Özellikle YouTube Shorts entegrasyonu dikkat çekiyor.
Google’ın YouTube ekosistemini doğrudan AI video üretimiyle birleştirmesi içerik üretim sürecini ciddi şekilde değiştirebilir.
Yapay Zeka Destekli Video Düzenleme Yeni Döneme Giriyor
Gemini Omni, Google’ın AI stratejisinde yeni dönemin başlangıcı olabilir.
Şirket artık yalnızca metin tabanlı yapay zekaya değil, doğrudan üretim tarafına da daha agresif yatırım yapıyor.
Önümüzdeki dönemde:
- AI video üretimi
- otomatik montaj
- dijital avatar sistemleri
- gerçekçi sahne düzenleme
gibi teknolojilerin çok daha yaygın hale gelmesi bekleniyor.
Google’ın yeni Gemini Omni modeli de bu dönüşümün en dikkat çekici adımlarından biri olmuş durumda.