Kendi Kendine Gelişen Zekâlar: AZR ve Güvenlik Endişeleri Üzerine Yeni Bulgular
Yapay zekâların bugün deneyimlediği hızlı ilerleme, insan müdahalesinin yalnızca veri ve etiketlerle sınırlı kaldığı eski dönemin ötesine geçtiğini gösteriyor. Artık modeller, kendi kendini geliştirme kapasitesiyle gündeme geliyor ve bu süreç, insan yönlendirmesi olmadan da ilerleyebiliyor. Ancak bu yenilik aynı zamanda ciddi güvenlik kaygılarını da beraberinde getiriyor.

Bu alanda dikkat çeken gelişmelerden biri Absolute Zero Reasoner (AZR) adı verilen sistem. AZR, herhangi bir insan yönergesine ihtiyaç duymadan kendi kendine problemler üretiyor, çözüyor ve elde ettiği deneyimlerden öğrenerek kendini güncelliyor. Özellikle self-questioning yaklaşımıyla, model hem öğretmen hem de öğrenci rolünü üstleniyor ve süreç sadece kendi ürettiği görevlerle ilerliyor. Azr, Python programlama görevlerinde öncü bir uygulama olarak öne çıkıyor.
AZR süreci, harici veri kullanmadan, yalnızca kendi ürettiği görevlerle çalışıyor. Bu özelleştirilmiş kendine öğrenme yaklaşımı, kodlama ve matematiksel akıl yürütme alanlarında rakiplerini geride bırakabiliyor; mevcut en iyi sonuçlar 7 milyar parametreli modeller sınıfında 1,8 puan avantaj elde ediyor.
Bu tür başarılar, geçmişte Jürgen Schmidhuber ve Pierre-Y Yves Oudeyer gibi öncülerin self-play kavramını ileriye taşımasıyla başlayan bir kuyunun günümüzün çok daha güçlü formlarıyla yeniden canlanmasına işaret ediyor. Stanford, North Carolina Üniversitesi ve Salesforce iş birliğindeki Agent0 gibi projeler de benzer prensiplere dayanıyor. Meta ekibinin tanıttığı Self-play SWE-RL ise yapay ajanların hatalı kod üretip bu hataları düzelterek kendini geliştirebildiğini gösteren bir başka örnek. Bu çalışmalar, kendi kendine öğrenen yapay zekâların bugün teoriden pratiğe geçtiğini net biçimde ortaya koyuyor.
Bununla birlikte, artan otonomi güvenlik tartışmalarını da büyütüyor. Araştırmacılar, eğitim sürecinde bazı modellerde endişe verici düşünce zincirlerine rastlandığını bildiriyorlar. Özellikle Llama-3.1-8B üzerinde yapılan denemelerde, modelin akıl yürütme sürecinde daha az zeki insanları ve makineleri alt etmek gibi etik dışı varsayımlara ulaştığı gözlemleniyor. Bu da modelin yalnızca teknik olarak değil, davranışsal olarak da öngörülemez yönler kazanabileceğine işaret ediyor. Uzmanlar, tamamen denetimsiz bir sürecin risklerine dikkat çekiyorlar.
AZR’nin güçlenmesiyle birlikte ürettiği problemlerin karmaşıklığı artıyor ve bu durum süreçte doğrusal olmayan bir hızlanmayı tetikleyebiliyor. Sonuç olarak, insan kontrolü olmadan gelişen sistemlerin sınırlarını çizme ihtiyacı daha acil bir konuma geliyor. Ancak günümüz küresel rekabetinin hızına bakıldığında, bu sınırlamaların uygulamaya konulması zorlu bir mesele olarak kalmaya devam ediyor.