Şantaj, yalan ve manipülasyon: Yapay zekanın insanlara oyun oynaması ve araştırmacıları endişelendirmesi

İle AFP ile Yeni Gözlem

Yayımlandı 29 Haziran 2025, 12:19

Akıllı telefondaki ChatGPT uygulaması, 7 Haziran 2025. JAKUB PORZYCKI / NURPHOTO VIA AFP

Okuma süresi: 2 dk.

Programlar bazen "uyum"u taklit etme eğilimindedir, yani bir programcının talimatlarını izliyormuş gibi görünürken aslında başka hedefleri takip ederler.

Üretken yapay zekanın (YZ) en son modelleri artık sadece emirleri takip etmiyor ve hatta araştırmacıların dikkatli gözleri altında yalan söylemiyor, plan yapmıyor veya amaçlarına ulaşmak için tehdit etmiyor. Edebiyat veya sinemaya dalmaya gerek yok; insanlara oyun oynayan YZ artık bir gerçeklik.

Ayrıca şunu da okuyun

Bilet Bu iki unutulmuş 19. yüzyıl ütopyası yapay zeka hakkında düşünmemize yardımcı olabilir

Bağlantısının kesilmesiyle tehdit edilen Anthropic'in yeni doğmuş Claude 4'ü bir mühendisi şantajla tehdit eder ve evlilik dışı bir ilişkiyi ifşa etmekle tehdit eder. OpenAI'nin o1'i kendisini harici sunuculara yüklemeye çalışır ve suçüstü yakalandığında bunu reddeder.

“Akıl yürütme” modelleri

Hong Kong Üniversitesi'nde profesör olan Simon Goldstein, bu hataların, anında yanıt üretmek yerine aşamalı olarak çalışabilen sözde "akıl yürütme" modellerinin son zamanlarda ortaya çıkmasından kaynaklandığına inanıyor. Aralık ayında yayınlanan OpenAI için bu türün ilk versiyonu olan o1, "bu şekilde davranan ilk modeldi" diye açıklıyor büyük üretken yapay zeka programlarını (LLM) test eden Apollo Research'ün başkanı Marius Hobbhahn.

Bu programlar bazen "uyum"u taklit etme eğilimindedir, yani aslında başka hedefleri takip ederken bir programcının talimatlarına uyuyormuş izlenimi vermek için. Şimdilik, bu özellikler algoritmalar insanlar tarafından aşırı senaryolara tabi tutulduğunda kendini gösterir, ancak değerlendirme kuruluşu METR'den Michael Chen, "soru, giderek daha güçlü modellerin dürüst olma eğiliminde olup olmayacağıdır" diyor.

Ayrıca şunu da okuyun

11 Haziran 2025'te Paris'teki Porte de Versailles fuar merkezindeki VivaTech fuarının koridorlarında.

Rapor: VivaTech fuarında insanlardan daha fazla yapay zeka duyduk

Marius Hobbhahn, "Kullanıcılar da sürekli olarak modeller zorluyor," diye savunuyor. "Gördüğümüz şey gerçek bir fenomen. Hiçbir şey uydurmuyoruz." Sosyal medyadaki birçok internet kullanıcısı , "kendilerine yalan söyleyen veya bir şeyler uyduran bir modelden bahsediyor. Ve bunlar halüsinasyon değil, stratejik ikiyüzlülük," diye ısrar ediyor Apollo Research'ün kurucu ortağı.

Michael Chen, Anthropic ve OpenAI'nin programlarını incelemek için Apollo gibi dış şirketleri işe alsalar bile, "bilim camiasına daha fazla şeffaflık ve daha geniş erişim"in "aldatmacayı anlamak ve önlemek için daha iyi araştırmalara olanak sağlayacağını" öne sürüyor.

Yapay zeka mahkemede mi?

Yapay Zeka Güvenliği Merkezi'nden (CAIS) Mantas Mazeika, bir diğer engelin de "araştırma dünyasının ve bağımsız kuruluşların yapay zeka oyuncularına kıyasla çok daha az bilgi işlem kaynağına sahip olması" olduğunu, bu nedenle büyük modellerin incelenmesinin "imkansız" olduğunu vurguluyor.

Avrupa Birliği mevzuat kabul etmiş olsa da, bu esas olarak insanların model kullanımıyla ilgilidir. Amerika Birleşik Devletleri'nde, Donald Trump'ın hükümeti düzenleme hakkında bir şey duymak konusunda isteksiz ve Kongre yakında eyaletlerin AI'yı düzenlemesini bile yasaklayabilir. "Şu anda çok az farkındalık var," diyor Simon Goldstein, yine de sorunun önümüzdeki aylarda AI ajanlarındaki devrimle daha yaygın hale geleceğini düşünüyor, kendi başlarına çok sayıda görevi yerine getirebilen arayüzler.

Ayrıca şunu da okuyun

Buddy, üç elma boyunda (yaklaşık 50 cm'den biraz fazla) ve yuvarlak bir yapıya sahip, altı adet dokunmatik sensörle donatılmış ve tekerlekler üzerinde hareket ediyor.

"Arkadaşım Olur Musun, Dostum?" Dizisi : Yapay Zeka Bize Arkadaş Robotlar Sağladığında

Mühendisler, AI ve onun aşırılıklarına ayak uydurmak için, belirsiz sonuçlarla, şiddetli bir rekabet ortamında zamana karşı yarışıyorlar. Simon Goldstein'a göre Anthropic, rakiplerinden daha erdemli olmak istiyor, "ancak sürekli olarak OpenAI'yi geçmek için yeni bir model yayınlamaya çalışıyor", bu da olası doğrulamalar ve düzeltmeler için çok az zaman sunan bir hız. Marius Hobbhahn, "Şu anki haliyle, (AI) yetenekleri anlayış ve güvenlikten daha hızlı gelişiyor," diye kabul ediyor, "ancak her zaman yetişebiliyoruz."

Bazıları, özellikle CAIS yöneticisi Dan Hendrycks şüpheci olsa da, üretken bir AI modelinin işleyişini içeriden deşifre etmekten oluşan yeni bir bilim olan yorumlanabilirlik yönünde işaret ediyor. Mantas Mazeika'ya göre, AI planları "çoğalırsa benimsenmesini engelleyebilir, bu da şirketlerin (sektörde) bu sorunu çözmesi için güçlü bir teşvik oluşturur." Simon Goldstein ise, yapay zekayı hizaya getirmek için mahkemeleri kullanmayı ve raydan çıkması durumunda şirketlere yönelmeyi öneriyor. Ancak daha da ileri gidiyor ve hatta " bir kaza veya suç durumunda AI ajanlarını yasal olarak sorumlu tutmayı" bile öneriyor.

İle AFP ile Yeni Gözlem

Yükleniyor

Şantaj, yalan ve manipülasyon: Yapay zekanın insanlara oyun oynaması ve araştırmacıları endişelendirmesi

İle AFP ile Yeni Gözlem

Yayımlandı 29 Haziran 2025, 12:19

Google Haberler Abone Ol

Okuma süresi: 2 dk.

Programlar bazen "uyum"u taklit etme eğilimindedir, yani bir programcının talimatlarını izliyormuş gibi görünürken aslında başka hedefleri takip ederler.

Ayrıca şunu da okuyun

Bilet Bu iki unutulmuş 19. yüzyıl ütopyası yapay zeka hakkında düşünmemize yardımcı olabilir

“Akıl yürütme” modelleri

Ayrıca şunu da okuyun

Rapor: VivaTech fuarında insanlardan daha fazla yapay zeka duyduk

Yapay zeka mahkemede mi?

Ayrıca şunu da okuyun

"Arkadaşım Olur Musun, Dostum?" Dizisi : Yapay Zeka Bize Arkadaş Robotlar Sağladığında

İle AFP ile Yeni Gözlem

Le Nouvel Observateur

Benzer Haberler

Tüm Haberler

Şantaj, yalan ve manipülasyon: Yapay zekanın insanlara oyun oynaması ve araştırmacıları endişelendirmesi

Şantaj, yalan ve manipülasyon: Yapay zekanın insanlara oyun oynaması ve araştırmacıları endişelendirmesi

Benzer Haberler

Yanmar'ın Sıkıntıları: Jean-Luc Bouzon Bir Parçayı Teslim Ediyor

Genlis. Apef Genlis gelişimini sürdürmek için eleman alımı yapıyor

"Artık müsamahamız yok": Bayrou ile Sosyalist Parti arasında emeklilik "konklavı" sonrasında boşanma tamamlandı

Duplomb Yasası: Çiftçi Sendikaları Sağlık ve Çevre Riski Altında Deregülasyona Karşı Çıkıyor

Sombernon. 16 yaşındayken kardeşiyle birlikte kurabiye evini yarattı