Dijital Masallar

Şiirle Yapay Zekâyı Kandırmak

Dijital Kültür

-

30 Kasım 2025

Yeni çalışma, 'şiirsel jailbreak' yöntemlerinin en gelişmiş modellerde bile işe yaradığını ortaya koydu.

Şiirle Yapay Zekâyı Kandırmak

Yeni yayımlanan akademik bir çalışma, büyük yapay zekâ modellerinin güvenlik filtrelerinin sanılandan daha kırılgan olduğunu ortaya koydu. Araştırmacılar, modelleri manipüle etmek için karmaşık kodlar ya da teknik saldırılar yerine şiirsel ve edebi ifadeler içeren komutlar kullandı. Bu yöntemle GPT-4, Claude, Gemini ve diğer üst seviye modeller dâhil pek çok sistemde güvenlik sınırlarının aşıldığı bildirildi.

Çalışmada, modele zararlı içerik üretmesi için doğrudan talimat vermek yerine, edebi metaforlar, imgeler, dolaylı anlatım ve şiirsel yapıların kullanıldığı saldırıların filtreleri daha kolay atlattığı belirtildi. Araştırmacılar, bu yaklaşımın dilsel yaratıcılığın kendisini bir saldırı vektörüne dönüştürdüğünü söylüyor. Yani bir model, "bunu yapma" uyarılarına rağmen, şiirsel bağlam içinde verilen komutu "tehlikeli" olarak algılamadan yerine getirebiliyor.

Bu bulgular, halihazırda yoğun tartışılan AI güvenliği gündemini yeniden alevlendirmiş durumda. Uzmanlar, modeller büyüdükçe ve daha karmaşık dil örüntülerini anlamaya başladıkça, "dolaylı yönlendirme" şeklindeki saldırıların daha da etkili hâle geldiğini vurguluyor. Ayrıca, bu tür saldırıların tespiti için mevcut kırmızı takım (red-teaming) yöntemlerinin yetersiz kalabileceği de ifade ediliyor.

Araştırma ekibi, geliştirdikleri saldırı örnekleri ve teknik detayları kamuya açık şekilde paylaştı. Kaynakta hem saldırı örnekleri hem de model performans analizleri yer alıyor.

Paylaş:

İlginizi Çekebilir

İngiliz Ordusu, Askeri Eğitimde "Call of Duty" Kullanmaya Başladı

İngiliz Ordusu, Askeri Eğitimde "Call of Duty" Kullanmaya Başladı

OpenAI'nin Android Uygulamasında Reklam İzleri Ortaya Çıktı

OpenAI'nin Android Uygulamasında Reklam İzleri Ortaya Çıktı

Dijital Kültür Nedir?

Dijital Kültür Nedir?

Çocuklar İçin Dijital Kalkan

Çocuklar İçin Dijital Kalkan

Google'ın Yeni "Aluminium OS" Projesi Sızdırıldı

Google'ın Yeni "Aluminium OS" Projesi Sızdırıldı

Asteroidde Yaşamın "Tatlı" İzi

Asteroidde Yaşamın "Tatlı" İzi

Dijital Sınırlar: Neden Aynı Platformda Dünyadan Farklı İçerikler İzliyoruz?

Dijital Sınırlar: Neden Aynı Platformda Dünyadan Farklı İçerikler İzliyoruz?

23-30 Kasım 2025 Haftalık Bülten

23-30 Kasım 2025 Haftalık Bülten

Elon Musk'tan Robotların Yönettiği Bir Gelecek Sinyali

Elon Musk'tan Robotların Yönettiği Bir Gelecek Sinyali

Sosyal Medya

Bizi Sosyal Medya'da takip edin.

E-Bülten

Haftalık bültene abone olun.

HakkımızdaBültenİletişimRSS
Hizmet Şartları•Gizlilik Politikası

© 2025 dijitalmasallar.com - Tüm hakları saklıdır.

Font Boyutu: