Technostory.net
KATEGORİLER
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER
TAKİP ET!
Technostory.net Technostory.net
Technostory.net Technostory.net
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER

Google DeepMind, Gemini 1.5 Pro’yu Gerçek Dünyada Gezinebilen Robotlara Entegre Ediyor

  • Ahmet Enveroğlu
  • 13 Temmuz 2024
Google DeepMind

Google DeepMind, perşembe günü robotik ve görsel dil modelleri (VLM’ler) alanında yapılan yeni ilerlemeleri paylaştı. Teknoloji devinin yapay zeka (AI) araştırma bölümü, robotlarda yeni yetenekler geliştirmek için ileri görsel modeller üzerinde çalışıyor. Yeni bir çalışmada DeepMind, Gemini 1.5 Pro ve uzun bağlam penceresini kullanarak robotlarının navigasyon ve gerçek dünya anlayışında çığır açtığını vurguladı. Bu yılın başlarında, Nvidia da insansı robotlarda ileri yetenekleri güçlendiren yeni AI teknolojisini tanıttı.

Google DeepMind, Gemini AI Kullanarak Robotları Geliştiriyor

Google DeepMind, X (eski adıyla Twitter) üzerinde yaptığı bir paylaşımda, robotlarını Gemini 1.5 Pro’nun 2 milyon token bağlam penceresini kullanarak eğittiğini açıkladı. Bağlam pencereleri, bir AI modeline görünür olan bilgi penceresi olarak anlaşılabilir ve bu, AI modelinin sorgulanan konuyla ilgili bilgileri işlemesini sağlar.

Örneğin, bir kullanıcı bir AI modeline “en popüler dondurma lezzetleri” hakkında soru sorarsa, AI modeli dondurma ve lezzetler anahtar kelimelerini kontrol eder ve bu soruya yanıt bulmak için bilgi arar. Bu bilgi penceresi çok küçükse, AI sadece farklı dondurma lezzetlerinin isimlerini verebilir. Ancak, pencere daha büyükse, AI ayrıca her dondurma lezzeti hakkında kaç makale olduğunu görüp “popülerlik faktörünü” çıkarabilir.

DeepMind, robotlarını gerçek dünya ortamlarında eğitmek için bu uzun bağlam penceresinden yararlanıyor. Bölüm, robotun bir ortamın ayrıntılarını hatırlayıp hatırlayamayacağını ve kullanıcıya ortam hakkında bağlamsal veya belirsiz terimlerle sorulduğunda yardımcı olup olamayacağını görmek istiyor. Instagram’da paylaşılan bir videoda, AI bölümü, bir kullanıcının çizim yapabileceği bir yer sorduğunda robotun onu bir beyaz tahtaya yönlendirebildiğini gösterdi.

“1.5 Pro’nun 1 milyon token bağlam uzunluğu ile donatılmış robotlarımız, insan talimatlarını, video turlarını ve sağduyu mantığını kullanarak bir alan içinde yollarını başarıyla bulabilirler” diye belirtti Google DeepMind bir gönderide.

DeepMind, arXiv’de (bir çevrimiçi dergi) yayınlanan bir çalışmada, bu teknolojinin arkasındaki teknolojiyi açıkladı. Gemini’ye ek olarak, kendi Robotic Transformer 2 (RT-2) modelini de kullanıyor. Bu, hem web hem de robotik verilerden öğrenen bir görsel-dil-aksiyon (VLA) modelidir. Bilgisayarlı görme kullanarak gerçek dünya ortamlarını işler ve bu bilgileri veri kümeleri oluşturmak için kullanır. Bu veri kümesi daha sonra bağlamsal komutları çözümleyip istenen sonuçları üreten yapay zeka tarafından işlenebilir.

Şu anda Google DeepMind, robotlarını ortam keşfi ve talimatla yönlendirilmiş navigasyonu içeren Multimodal Instruction Navigation (MIN) adı verilen geniş bir kategori üzerinde eğitmek için bu mimariyi kullanıyor. Bölüm tarafından paylaşılan gösterim doğruysa, bu teknoloji robotik alanında daha ileriye taşınabilir.

Etiketler
  • Gemini
  • Gemini 1.5 Pro
  • Google
Ahmet Enveroğlu

Önceki Yazı
WhatsApp 1

WhatsApp, Android için Google Teknolojisini Kullanarak Mesajlar İçin Çeviri Özelliğini Test Ediyor

  • Ahmet Enveroğlu
  • 13 Temmuz 2024
Şimdi Oku
Sıradaki Yazı
1720775967 Tulpar T6 V2.1.5 AI Creator 9

Monster, Tulpar T6 V2.1.5 ile Yapay Zekanın Gücünden Faydalanıyor

  • Asu Bozyayla
  • 13 Temmuz 2024
Şimdi Oku
Bakmadan Geçmeyin
metro
Şimdi Oku

Metro Serisi %90 İndirimde: Metro 2039 Öncesi Kaçırılmayacak Fırsat

  • 18 Nisan 2026
galaxy s27 ultra
Şimdi Oku

Galaxy S27 Ultra Masaüstü PC Performansıyla Geliyor

  • 18 Nisan 2026
macbook
Şimdi Oku

Hangi MacBook Alınmalı: Neo, Air ve Pro Karşılaştırması

  • 18 Nisan 2026
Save The World
Şimdi Oku

Fortnite Save The World Ücretsiz Oldu

  • 18 Nisan 2026
Call of Duty Mobile Sezon 4
Şimdi Oku

Call of Duty: Mobile Sezon 4 ile Rebirth Island geri dönüyor

  • 18 Nisan 2026
predator helios neo 16 ai
Şimdi Oku

Predator Helios Neo 16 AI: RTX 5070 Ti ve Ultra 9 Performansı

  • 17 Nisan 2026
HP
Şimdi Oku

Basına Özel İlham Dolu Bir Gün: HP’nin AI Vizyonunu Ofislerinde Deneyimledik

  • 17 Nisan 2026
Dreame Türkiye Lansmanı 2026
Şimdi Oku

Dreame Türkiye Lansmanı 2026: Yeni Ürünler ve İnceleme

  • 17 Nisan 2026
casper nirvana hibrit calismasi
Şimdi Oku

Casper Nirvana: Hibrit Çalışma İçin Hafif ve Güçlü Laptop

  • 17 Nisan 2026
dan cham roborock turkiye lansmani
Şimdi Oku

Roborock Türkiye Lansmanı 2026: Yeni Saros ve Qrevo Serisi

  • 17 Nisan 2026
microsoft
Şimdi Oku

Microsoft Yama Yayınladı, Hacker Saatler İçinde Yenisini Paylaştı

  • 17 Nisan 2026
Intel Core Series 3
Şimdi Oku

Intel Core Series 3 Sahneye Çıktı: Daha Ucuz, Daha Güçlü, AI Destekli

  • 17 Nisan 2026

Bir yanıt yazın Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

STORY HUNTER
  • HP 1
    Basına Özel İlham Dolu Bir Gün: HP’nin AI Vizyonunu Ofislerinde Deneyimledik
    • 17.04.26
  • Dreame Türkiye Lansmanı 2026 2
    Dreame Türkiye Lansmanı 2026: Yeni Ürünler ve İnceleme
    • 17.04.26
  • dan cham roborock turkiye lansmani 3
    Roborock Türkiye Lansmanı 2026: Yeni Saros ve Qrevo Serisi
    • 17.04.26
  • dt cloud dijital egemenlik vizyonu 4
    DT Cloud Dijital Egemenlik: Bulut Vatan ve Yeni Stratejiler
    • 15.04.26
  • ticimax partner bulusmasi 2026 sahne 5
    Ticimax’tan Ezber Bozan Hamle: Bayiler Artık Kendi Teknoloji Markasını Kuruyor!
    • 13.04.26
  • sestek agentic cx summit 2026 6
    Sestek Agentic CX Summit 2026: Etkinlik İzlenimlerim
    • 13.04.26
  • pozitif teknoloji egitim teknolojileri toplantisi.jpg 7
    Pozitif Teknoloji Eğitim Teknolojileri ve iSelect Çözümleri
    • 10.04.26
  • mova turkiye lansmani rixos tersane istanbul.jpg 8
    MOVA Türkiye Lansmanındaydık: Akıllı Ev Ekosisteminde Yeni Dönem!
    • 08.04.26
  • yayin resize 11 1 9
    Türk Telekom 5G hologram deneyimi AKM’de
    • 31.03.26
  • Vodafone etkinlik alani 10
    Vodafone 5G Türkiye lansman deneyimi ve detaylar
    • 31.03.26

Technostory, teknoloji dünyasındaki güncel gelişmeleri, ürün lansmanlarını ve dijital trendleri sade, güvenilir ve anlaşılır bir dille sunan bağımsız bir teknoloji yayın platformudur.

  • Hakkımızda
  • Künye
  • İletişim

Aramak istediğinizi yazın ve "Enter"a basın.