Technostory.net
KATEGORİLER
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER
TAKİP ET!
Technostory.net Technostory.net
Technostory.net Technostory.net
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER

OpenAI’ın o3 Yapay Zeka (AI) Modeli, Beklenenden Düşük Puan Aldı

  • Haber Merkezi
  • 21 Nisan 2025
OpenAI o3 akil yurutme yapay zeka ai

OpenAI’ın insan seviyesinde zekaya sahip olduğu iddia edilen o3 serisi yapay zeka (AI) modeli için kıyaslama sonuçları arasındaki tutarsızlık, şirketin şeffaflığı ve modelin test uygulamaları hakkında soru işaretlerini gündeme getirdi.

OpenAI, o3 yapay zeka (AI) akıl yürütme modelini 2024 yılının aralık ayında tanıtmıştı. Şirket, tanıtım sürecinde modelin FrontierMath’teki soruların dörtte birinden biraz fazlasını, yani zorlu matematik problemlerini yanıtlayabileceğini iddia etti. Bir sonraki en iyi model, FrontierMath problemlerinin yalnızca %2’sini doğru yanıtlamayı başardı.

OpenAI’ın baş araştırma görevlisi Mark Chen, canlı yayın sırasında “Bugün, piyasadaki tüm teklifler (FrontierMath’te) %2’den az. Dahili olarak, agresif test zamanı hesaplama ayarlarında o3 ile %25’in üzerine çıkabildiğimizi görüyoruz” açıklamasını yaptı.

FrontierMath’in arkasındaki araştırma enstitüsü Epoch AI, geçtiğimiz cuma günü o3 yapay zeka modelinin bağımsız kıyaslama testlerinin sonuçlarını yayınladı. Epoch, o3’ün OpenAI’nin iddia edilen en yüksek puanının oldukça altında, yaklaşık %10 puan aldığını duyurdu.

OpenAI’ın o3 Yapay Zeka (AI) Modelinin, Beklenenden Düşük Puan Almasının Nedeni

Şirketin aralık ayında yayınladığı kıyaslama sonuçları, Epoch’un gözlemlediği puanla eşleşen bir alt sınır puanı gösteriyor. Epoch ayrıca test kurulumunun OpenAI’ninkinden muhtemelen farklı olduğunu ve değerlendirmeleri için FrontierMath’in güncellenmiş bir sürümünü kullandığını belirtiyor. Epoch, “Sonuçlarımız ile OpenAI’ın sonuçları arasındaki fark, OpenAI’nin daha güçlü bir dahili yapı iskelesi ile değerlendirme yapmasından, daha fazla hesaplama süresi kullanmasından veya bu sonuçların FrontierMath’in farklı bir alt kümesinde çalıştırılmış olmasından kaynaklanıyor olabilir” açıklamasını yaptı.

Etiketler
  • AI
  • akıl yürütme
  • Epoch
  • FrontierMath
  • o3
  • openai
  • Yapay Zeka
Haber Merkezi

Önceki Yazı
whatsapp 1

WhatsApp’tan Kullanıcı Güvenliği İçin Yeni Özellik

  • Haber Merkezi
  • 21 Nisan 2025
Şimdi Oku
Sıradaki Yazı
yapay zeka temelli kisisellestirilmis ogrenme cocuklari gelecege tasiyor Tecnostory

Yapay Zekâ Temelli Kişiselleştirilmiş Öğrenme Çocukları Geleceğe Taşıyor

  • Haber Merkezi
  • 21 Nisan 2025
Şimdi Oku
Bakmadan Geçmeyin
DuckDuckGo nedir?
Şimdi Oku

DuckDuckGo Nedir? Gizlilik Odaklı Arama Motoru Türkiye’de Nasıl Kullanılır?

  • 30 Mayıs 2026
Edisyn
Şimdi Oku

Edisyn Yapay Zekâ Toplantı Asistanı, 3 Türk Mühendis Kurdu, 550 Milyon Kullanıcının Sorununa Çözüm Oldu

  • 30 Mayıs 2026
xiaomi 17t renk secenekleri
Şimdi Oku

Xiaomi 17T Serisi Tanıtıldı: 7000 mAh Batarya, Leica Live Moment ve 4K 60fps Video

  • 29 Mayıs 2026
GM 26 Pro 5G
Şimdi Oku

General Mobile GM 26 Pro 5G Tanıtıldı: Türkiye’de Bir İlk Olan AMOLED Arka Ekranla Geliyor!

  • 27 Mayıs 2026
Sennheiser Momentum 5 Wireless
Şimdi Oku

Sennheiser Momentum 5 Wireless Tanıtıldı: Dolby Atmos ve 57 Saat Pil Ömrüyle Geliyor

  • 26 Mayıs 2026
Dijitalde Hayat Kolay
Şimdi Oku

Türk Telekom Destekli 50 Bin Kadın Girişimci, Yerel Ürünleri Dünya Pazarına Taşıdı

  • 26 Mayıs 2026
şehir içi elektrikli motosiklet
Şimdi Oku

Şehir İçi Elektrikli Motosikletler: Yaz Aylarında Ulaşım İçin Elektrikli Motosiklet Rehberi

  • 26 Mayıs 2026
Elektrikli Motosiklet
Şimdi Oku

Elektrikli Motosiklet Alacaklar Dikkat: 2026’da Ehliyet, Plaka ve Batarya Detayları Öne Çıkıyor

  • 25 Mayıs 2026
NFC dolandırıcılığı
Şimdi Oku

NFC Dolandırıcılığı 2026’da %188 Patladı: Yeni Nesil Mobil Dolandırıcılık Türkiye’ye de Sıçradı

  • 25 Mayıs 2026
Xreal Project Aura
Şimdi Oku

Xreal’in CEO’sundan Çarpıcı İtiraf: “Akıllı Gözlük Sektöründe Herkes Para Kaybediyor”

  • 25 Mayıs 2026
dreo
Şimdi Oku

DREO Akıllı Ev Teknolojileri ile Türkiye’de 1. Yıl ve Yaz Lansmanı

  • 24 Mayıs 2026
Gemini Omni
Şimdi Oku

Google’dan Yeni Yapay Zeka Hamlesi: Gemini Omni Video Üretimini Baştan Değiştirebilir

  • 23 Mayıs 2026
Sponsorlu İçerik
STORY HUNTER
  • dreo 1
    DREO Akıllı Ev Teknolojileri ile Türkiye’de 1. Yıl ve Yaz Lansmanı
    • 24.05.26
  • pelin yelkencioglu 2
    Securitas Technology 2026: Yeni Nesil Güvenlik Teknolojileri Trendleri
    • 11.05.26
  • emre hantaloglu 3
    Lenovo Türkiye Pazar Liderliği: 6 Yıldır Zirvede
    • 29.04.26
  • tff turk telekom yayin haklari imza 4
    TFF Türk Telekom Yayın Hakları Anlaşması: Alt Ligler Tivibu’da
    • 27.04.26
  • ROG Zephyrus Duo 5
    ASUS ve ROG 2026 Türkiye Lansmanı: AI Laptop Serisi
    • 25.04.26
  • honor besiktas basketbol imza toreni 6
    HONOR Beşiktaş Basketbol Sponsorluğu: Potada Teknoloji Dönemi
    • 22.04.26
  • gozde kucukyilmaz haier turkiye lansmani.jpg 7
    Haier Türkiye Lansmanı 2026: Yeni Soğutma Teknolojileri
    • 22.04.26
  • HP 8
    Basına Özel İlham Dolu Bir Gün: HP’nin AI Vizyonunu Ofislerinde Deneyimledik
    • 17.04.26
  • Dreame Türkiye Lansmanı 2026 9
    Dreame Türkiye Lansmanı 2026: Yeni Ürünler ve İnceleme
    • 17.04.26
  • dan cham roborock turkiye lansmani 10
    Roborock Türkiye Lansmanı 2026: Yeni Saros ve Qrevo Serisi
    • 17.04.26

Technostory, teknoloji dünyasındaki güncel gelişmeleri, ürün lansmanlarını ve dijital trendleri sade, güvenilir ve anlaşılır bir dille sunan bağımsız bir teknoloji yayın platformudur.

  • Hakkımızda
  • Künye
  • İletişim

Aramak istediğinizi yazın ve "Enter"a basın.