Yapay zekâ destekli görsel düzenleme alanında dikkat çekici bir gelişme yaşandı. “Nano banana” adı verilen yeni model, LMArena’nın görsel düzenleme liderlik tablosunda zirveye yerleşti. Google, bu modelin DeepMind ekibi tarafından geliştirildiğini ve bugünden itibaren Gemini uygulamasına entegre edildiğini açıkladı.
Gemini 2.5 Flash Image: Tutarlılıkta devrim
Görsel düzenleme, bir fotoğrafı Photoshop gibi araçlarla tek tek uğraşmak yerine yalnızca bir komutla değiştirme imkânı sunuyor. Google, yılın başında Gemini’ye görsel düzenleme özelliğini eklemişti ancak üretken YZ’nin doğası gereği sonuçlar zaman zaman tutarsız olabiliyordu.
Yeni nano banana modeli (teknik adıyla Gemini 2.5 Flash Image), düzenleme sırasında orijinal görüntüdeki detayları koruyabiliyor ve her değişiklikte “zar atma” etkisini ortadan kaldırıyor. Google’a göre, yüzler veya nesneler, birden fazla düzenlemede bile görünümünü koruyor.

Kullanıcılar için ne değişiyor?
- Kişilerin fotoğraflarıyla stillerini değiştirmek: Örneğin, birini matador ya da 90’lar dizisi karakteri olarak yeniden hayal etmek mümkün — üstelik yüz aynı kalıyor.
- Birden fazla görüntüyü birleştirmek: Farklı fotoğraflardan tek bir kare oluşturulabiliyor. Google’ın örneğinde, ayrı çekilmiş bir kadın ve köpek fotoğrafı, köpeğin kucaklandığı bir kareye dönüştürülüyor.
- Soyut düzenlemeler: Kullanıcılar, modelin koruma ilkelerine aykırı olmayan her türlü isteği verebiliyor.
Gizli ve görünür filigran koruması
Üretilen tüm görsellerin köşesinde “AI” ibaresi bulunuyor. Ayrıca SynthID adlı görünmez bir dijital filigran ekleniyor ve bu işaret, orta düzeyde değişiklikler yapılsa bile tespit edilebiliyor.
Yeni model bugünden itibaren Gemini uygulamasında kullanılabilir. Google, önümüzdeki günlerde bu özelliği Gemini API, AI Studio ve Vertex AI üzerinden geliştiricilere de sunacak.