Gemini Düşünce Süreçlerini Ele Geçirme Girişimleri ve Distilasyon Saldırılarının Analizi
Google, yapay zeka sohbet botu Gemini’nin mantıksal çıkarım süreçlerini hedefleyen ve bu süreçleri ele geçirmeyi amaçlayan yoğun bir saldırı dalgasını raporladı. Tehdit İstihbarat Grubu’nun son raporunda, bu tür girişimlerin Gemini’nin düşünce mekanizmasına dair içgörü elde etmek için tasarlandığı ve 100.000’den fazla istek ile denendiği belirtildi.

Damıtma saldırıları olarak adlandırılan bu yöntemler, sohbet botuna ardı ardına sorular sorarak modelin nasıl çalıştığını açığa çıkarmayı amaçlar. Google, bu tür çabaları yaygın olarak model çıkarımı olarak tanımlıyor ve operasyonların ardında taklit etmek isteyenlerin sistemin mantıksal yapılarını ve örüntülerini çözmeye çalıştığını vurguluyor. Bu bilgilerle rakip yapay zeka çözümleri geliştirmeyi hedefleyen aktörler çoğunlukla özel şirketler veya araştırmacılar olarak değerlendiriliyor.
Şirket, saldırıların dünyanın çeşitli bölgelerinden geldiğini düşünse de şüpheliler hakkında daha ayrıntılı bilgi paylaşmayacağını belirtti. OpenAI’nin, DeepSeek’i benzer bir saldırı yöntemi kullanmakla suçladığı haberleriyle de bağlantılı olarak, distilasyon yaklaşımını fikri mülkiyet hırsızlığı olarak gördüklerini ifade etti. Büyük dil modellerine yatırım yapan teknoloji şirketleri için bu tür iç yapısal bilgiler, ticari sırlar arasında en değerli olanlar arasında yer alıyor.
Günümüzde büyük LLM’ler, bu tür damıtma saldırılarını tespit etmek ve engellemek için çeşitli mekanizmalar geliştirse de, internet üzerinde olmaları nedeniyle savunmasız kaldıkları noktalar bulunuyor. ChatGPT’nin geliştiricisi OpenAI de geçen yıl Çinli bir rakip olan DeepSeek’i, kendi modellerini iyileştirmek amacıyla bu tür saldırılar gerçekleştirmekle suçlamıştı.