Apertus: İsviçre’nin Şeffaf ve Güvenilir Çok Dilli Dil Modeli
yapay zeka rekabeti bugün daha çok ABD ve Çin ekseninde şekillense de Avrupa da bu alanda önemli adımlar atıyor. Avrupa çıkışlı şirketler, özellikle Mistral ve DeepL gibi isimlerle dikkat çekiyor; ancak girişimler sadece şirketlerle sınırlı kalmıyor. Devletler de bu alanda çalışmalarını hızlandırıyor ve İsviçre, bu yıl kendi büyük dil modelini (LLM) tanıtarak öne çıkıyor.
Apertus, İsviçre’nin bu alandaki iddialı girişimini temsil ediyor. Açık kaynaklı bir yapay zeka olan Apertus, ChatGPT ve Google Gemini gibi kapalı sistemlere karşı daha güvenilir ve şeffaf bir alternatif sunmayı hedefliyor. Ayrıca Avrupa’nın yasal çerçevelerine ve yürütmeliklerine uyum gösteren bir yapay zeka olma vaadi taşıyor.

Apertus, EPFL, ETH Zürih ve CSCS iş birliğiyle geliştirildi. Modelin mimarisi, eğitim verileri, ağırlıkları ve ara denetim noktaları tamamen kamuya açık şekilde paylaşılıyor; bu sayede süreç şeffaflık açısından önemli bir fark yaratıyor. Buna paralel olarak ismi de Latince’deki açık anlamını yansıtacak şekilde seçildi: Apertus.
Apertus, Çokdilli Yapısıyla Dikkat Çekiyor Teknik olarak iki sürümle sunulan Apertus, 8 milyar ve 70 milyar parametreli olmak üzere iki farklı kapasiteye sahip. 15 trilyon token üzerinde eğitildi ve 1000’den fazla dili kapsıyor. İngilizce dışındaki dillerin oranı yaklaşık %40’a yaklaşırken, İsviçre Almancası ve Romanş gibi az temsil edilen diller için de özel dikkate yer verildi. Bu çokdilli bilgiyle Apertus, genelde İngilizce ağırlıklı modellere kıyasla farklı bir konum elde ediyor.
Modelin eğitim süreci Lugano’daki Alps süper bilgisayarı üzerinden 10 milyonun üzerinde GPU ile gerçekleştirildi ve operasyon boyunca karbon nötr elektrik kullanımı hedeflendi. Ayrıca kurumsal kullanıcıların verilerini üçüncü taraflarla paylaşmadan kendi altyapılarında barındırmasına olanak tanıması, veri güvenliğine odaklı bir avantaj olarak öne çıkıyor.
Apertus’un Amacı güvenilir, egemen ve kapsayıcı bir yapay zekâ geliştirme yol haritasını sunmaktır. İsviçreli araştırmacılar, verilerin yüksek standartlarda yasal uyuma uygun olarak toplandığını ve Avrupa Birliği’nin Yapay Zekâ Yasası çerçevesine uyum sağlandığını vurguluyorlar. Eğitim verileri sadece kamuya açık kaynaklardan elde ediliyor ve kişisel veriler için gerekli ayık çalışmalar yapılıyor. Ayrıca telif ihlallerine yol açmadan büyük dil modelleri üretmenin mümkün olduğunu göstermesi açısından da dikkate değer bir çalışmadır.
İsviçre Yapay Zekâ İnisiyatifi Yürütme Komitesi’nde yer alan Martin Jaggi, şu yaklaşımı özetliyor: “Amacımız, güvenilir, egemen ve kapsayıcı bir yapay zekâ modelinin nasıl geliştirilebileceğine dair bir yol haritası sunmaktır.” Bu şeffaflık, kamuoyunda güven tesis etmeye ve yapay zekânın potansiyel riskleri konusundaki endişeleri azaltmaya odaklanıyor. Avrupa’da bu alanda atılan somut adımlar, Apertus gibi devlet onaylı modellerin standart belirleyici konumuna gelebileceğini gösteriyor.