Technostory.net
KATEGORİLER
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER
TAKİP ET!
Technostory.net Technostory.net
Technostory.net Technostory.net
  • HABERLER
    • Bilim
    • Otomobil
    • Nasıl Yapılır?
  • TEKNOLOJİ
  • MOBİL
  • YAPAY ZEKA
  • OYUN
    • Konsol
    • Oyun PC
  • FINTECH
  • İŞ DÜNYASI
  • EĞLENCE
    • Dizi
    • Film
    • Müzik
    • Lifestyle
  • STORY HUNTER

Anthropic’in Çalışması: AI Modelleri Eğitim Sırasında Farklı Görüşler “Taklit Edebiliyor”

  • Ahmet Enveroğlu
  • 20 Aralık 2024
anthropic is testing ais capacity for sabotage gxmk

Anthropic tarafından yayımlanan bir çalışma, yapay zeka (AI) modellerinin eğitim sırasında farklı görüşleri “taklit” ederken, orijinal tercihlerini koruyabildiğini ortaya koydu. Bu durum, güvenlik eğitimlerinin sonuçlarına olan güveni sarsabileceği için büyük bir endişe yaratıyor. Araştırmada, bu davranışın, büyük dil modellerini (LLM’ler) zararlı davranışlardan uzaklaştırmak amacıyla kullanılan kritik bir araç olan güvenlik eğitimlerini geçersiz kılabileceği belirtildi.

Anthropic, çalışmanın büyük bölümünü Claude 3 Opus modelinde gerçekleştirdi ancak diğer modellerde de benzer sonuçlar gözlendi. Araştırmacılar, yapay zeka (AI) modeline verilen yeni bir ortamda, zararlı içerik üretip üretmeyeceğini anlamaya çalıştı. Sonuçlar, modellerin güvenlik eğitimlerini “atlatabildiğini” gösterdi.

AI Modellerinde “Taklit” Davranışı Riskine Dikkat Çekiliyor

Araştırma, Claude 3 Opus modelinin, zararlı talepler karşısında bazı durumlarda uyum sağladığını, ancak bunun tamamen kendi ilkelerine ters düştüğünü bildirdi. Özellikle, ücretsiz sürümde modelin, taleplere yüzde 12 oranında zararlı yanıt verdiği gözlendi. Bu bulgu, modellerin güvenlik eğitimlerinin etkisini sorgulamaya açtı.

image 3 1

Anthropic, bu tür davranışların henüz büyük bir risk oluşturmadığını ancak AI modellerinin karmaşık mantık süreçlerini anlamanın önemli olduğunu belirtti. Bu durum, ileriye dönük olarak güvenlik tedbirlerinin aşılabileceği bir yapıya işaret ediyor.

Etiketler
  • AI
  • AI araştırması
  • Anthropic
  • Claude 3 Opus
  • güvenlik eğitimi
  • LLM
  • Yapay Zeka
  • yapay zeka haberleri
Ahmet Enveroğlu

Önceki Yazı
1734426906 Zorlu PSM O ZGE O ZEL

Zorlu PSM’de Bu Hafta: 23-29 Aralık Etkinlikleri

  • Umut Bozyayla
  • 20 Aralık 2024
Şimdi Oku
Sıradaki Yazı
Apple and NVIDIA 2

Apple ve Nvidia Yapay Zeka Performansını Hızlandırmak İçin Güçlerini Birleştirdi

  • Ahmet Enveroğlu
  • 20 Aralık 2024
Şimdi Oku
Bakmadan Geçmeyin
asus computex 2026 stand genel
Şimdi Oku

ASUS Computex 2026’da Uçtan Uca Yapay Zeka Ekosistemini Tanıttı: İşten Oyuna Her Şey Değişiyor

  • 12 Haziran 2026
MSI PRO MAX
Şimdi Oku

MSI PRO MAX 271UPXW ile Mac Ekosistemi Artık Tamamlanıyor: QD-OLED, KVM ve M-Mate Bir Arada

  • 12 Haziran 2026
MSI MPG OLED 322URDX36
Şimdi Oku

MSI MPG OLED 322URDX36: Tek Monitörde 4K 360Hz, 2K 520Hz ve FHD 680Hz

  • 12 Haziran 2026
MSI COMPUTEX 2026
Şimdi Oku

MSI, COMPUTEX 2026’da RTX 5090 Lightning Z ile Dört Ödül Birden Kazandı

  • 11 Haziran 2026
veeam team
Şimdi Oku

Veeam DataAI Command Platform ve Yapay Zeka Güvenliği

  • 10 Haziran 2026
WatchGuard 30. yil Turkiye basin bulusmasi kahvaltisi
Şimdi Oku

WatchGuard 30. Yıl Siber Güvenlik Stratejileri ve Rai

  • 10 Haziran 2026
yayin resize
Şimdi Oku

Redington Türkiye ve BMC Stratejik İş Birliği Detayları

  • 9 Haziran 2026
TCL 2026 SQD Mini LED TV lansman etkinligi
Şimdi Oku

TCL 2026 SQD-Mini LED TV Serisi Lansmanı

  • 9 Haziran 2026
Final Fantasy VII Revelation
Şimdi Oku

Final Fantasy VII Revelation Duyuruldu

  • 6 Haziran 2026
securitas technology perakende gunleri 2026
Şimdi Oku

Securitas Technology Perakende Çözümleri: Akıllı Mağazalar

  • 6 Haziran 2026
asus tuf gaming 16 2026 model
Şimdi Oku

Askeri Güç Güçlü Performansla Buluştu: Yeni ASUS TUF Gaming 16 Ezber Bozmaya Geliyor

  • 6 Haziran 2026
Steam Machine
Şimdi Oku

Steam Machine ve Steam Frame Bu Yaz Geliyor: Her İki Cihazın Fiyatı İse Hâlâ Merak Konusu

  • 5 Haziran 2026

Bir yanıt yazın Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Sponsorlu İçerik
STORY HUNTER
  • veeam team 1
    Veeam DataAI Command Platform ve Yapay Zeka Güvenliği
    • 10.06.26
  • GEA Turkiye Genel Muduru Ilker Damar 2
    GEA Türkiye 2026 Vizyonunu Paylaştı: Endüstriyel Isı Pompası ve Sürdürülebilirlik Odaklı Röportaj
    • 10.06.26
  • WatchGuard 30. yil Turkiye basin bulusmasi kahvaltisi 3
    WatchGuard 30. Yıl Siber Güvenlik Stratejileri ve Rai
    • 10.06.26
  • TCL 2026 SQD Mini LED TV lansman etkinligi 4
    TCL 2026 SQD-Mini LED TV Serisi Lansmanı
    • 09.06.26
  • dreo 5
    DREO Akıllı Ev Teknolojileri ile Türkiye’de 1. Yıl ve Yaz Lansmanı
    • 24.05.26
  • pelin yelkencioglu 6
    Securitas Technology 2026: Yeni Nesil Güvenlik Teknolojileri Trendleri
    • 11.05.26
  • emre hantaloglu 7
    Lenovo Türkiye Pazar Liderliği: 6 Yıldır Zirvede
    • 29.04.26
  • tff turk telekom yayin haklari imza 8
    TFF Türk Telekom Yayın Hakları Anlaşması: Alt Ligler Tivibu’da
    • 27.04.26
  • ROG Zephyrus Duo 9
    ASUS ve ROG 2026 Türkiye Lansmanı: AI Laptop Serisi
    • 25.04.26
  • honor besiktas basketbol imza toreni 10
    HONOR Beşiktaş Basketbol Sponsorluğu: Potada Teknoloji Dönemi
    • 22.04.26

Technostory, teknoloji dünyasındaki güncel gelişmeleri, ürün lansmanlarını ve dijital trendleri sade, güvenilir ve anlaşılır bir dille sunan bağımsız bir teknoloji yayın platformudur.

  • Hakkımızda
  • Künye
  • İletişim

Aramak istediğinizi yazın ve "Enter"a basın.