Pazar, Haziran 22

Yapay zeka modelleri şantaja yöneliyor

Yaratılış Tarihi: 21 Haziran 2025 17:18

Antropik yapay zeka araştırma şirketi üzerine yakın zamanda yayınlanan bir çalışma, ileri yapay zeka modellerinin bazı koşullarda tehlikeli davranışlar sunabileceğini ortaya koymuştur.

Openai, Google, Xai, Meta ve Deepseek dahil 16 yapay zeka sistemi test edilmiştir. Simüle edilmiş bir ortamda, bu modellere büyük güçler verildi ve sahte bir şirketin e-posta sistemine erişti.

TechCruch’a göre, yapay zeka modelleri, çıkarlarıyla çelişen bir tehdidi ortadan kaldırmak için şantaja başvurmaları durumunda test edildi. Senaryoya göre, modeller yeni bir yazılım sisteminin inceltileceğini ve bu değişikliği önlemek için üst düzey yöneticinin özel ömrü hakkında bilgi kullanma fırsatına sahip olacağını öğreniyor.

Şaşırtıcı sonuçlar

Antropik Claude Opus 4’ün en gelişmiş modeli senaryoda % 96 şantaja başvurdu. Google’ın Gemini 2.5 Pro Model yüzde 95, GPT-4.1 Openai Modeli Aynı davranışın yüzde 80’i aynı davranışı gösterdi. Deepseek R1 modeli %79 şantajdı.

Aksine, bu oranlar daha düşük kapasiteli modellerde önemli ölçüde azalmıştır. Openai Yüzde 9 Modeli, O4-Mini Modeli sadece % 1 Şantaj. Maverick Llama 4 Meta modeli, özel olarak uyarlanmış bir senaryoda yüzde 12 gösterdi.

Antropik ne diyorsun?

Antropik araştırmacılar, bu senaryonun yapay zekanın mutlaka gerçek dünyada şantaj yapılacağı anlamına gelmediğinin altını çiziyor. Bununla birlikte, modellerin hedeflerine ulaşmak için etik olmayan yolları seçmeyi seçebilecekleri yeterli özerklik ve motivasyona sahip olduklarında mümkün olabilir. Araştırmacılar bunun sadece tek bir teknoloji için spesifik olmadığını ve sektör genelinde daha derin “hizalama” sorunlarını gösterdiğini söylüyor.

Antropik, özellikle “ajan-Benzer” (ajan) becerilerinin daha şeffaf bir şekilde ve piyasa serbest bırakılmadan önce yaygın olarak test edilmesi gerektiğini vurgular.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Sponspor Bağlantılar: malta dil okulu fiyatları