TranslateGemma: Google’dan Açık Kaynaklı Çok Dilli Çeviri Ailesi ve İki Aşamalı Eğitim Yaklaşımı

TranslateGemma: Google’dan Açık Kaynaklı Çok Dilli Çeviri Ailesi ve İki Aşamalı Eğitim Yaklaşımı

Google, açık ağırlıklı Gemma 3 tabanlı yeni bir açık çeviri model ailesini tanıttı. TranslateGemma olarak adlandırılan bu model serisi, açık çeviri alanında önemli bir dönüm noktası olarak görülüyor ve 55 farklı dil arasında İspanyolca, Fransızca, Çince ve Hintçe gibi popüler dilleri de kapsıyor.

TranslateGemma: Google’dan Açık Kaynaklı Çok Dilli Çeviri Ailesi ve İki Aşamalı Eğitim Yaklaşımı

ChatGPT Translate ile aynı dönemde duyurulması, OpenAI’nin tescilli çeviri aracının haberinin hemen ardından geldi. ChatGPT Translate, kelimelerin ötesinde ton ve bağlama odaklı bir çeviri yaklaşımı sunmasıyla dikkat çekiyor ve çift panel arayüzüyle otomatik dil algılamayı da içeriyor.

Üç farklı model boyutu ile kullanıcılar 4B, 12B ve 27B seçeneklerinden tavsiyeye göre yararlanabiliyor. 12B boyutundaki model, WMT24++ benchmarklarında temel 27B sürümünden daha üstün sonuçlar verebiliyor; bu da geliştiriciler için hız ve verimlilik açısından önemli bir avantaj anlamına geliyor. Daha küçük boyutlar ise mobil cihazlardan günlük bilgisayarlara kadar geniş bir kullanım alanı sunuyor. En büyük 27B sürümü ise yalnızca NVIDIA H100 gibi güçlü bulut donanımlarıyla çalışabilir durumda.

TranslateGemma’nın görsel metinleri de başarılı şekilde çevirebildiği belirtiliyor. Bu başarının, modelin bu özel alan için özel eğitim almamış olmasına rağmen elde edildiği ifade ediliyor.

İki aşamalı eğitim süreciyle elde edilen performans, Google’ın vurguladığı bir diğer önemli nokta. İlk aşamada, Gemma 3 modelleri insan çevirmenlerin sağladığı verilerle ve yüksek kaliteli sentetik verilerle denetimli ince ayar sürecine tabi tutuldu. Ardından pekiştirmeli öğrenme devreye girerek, MetricX-QE ve AutoMQM gibi gelişmiş değerlendirme metriklerini kullanarak çevirilerin daha doğal ve bağlama uygun hale gelmesini sağladı.

Kaggle ve Hugging Face üzerinden erişilebilirlik ile TranslateGemma modelleri denemek veya kendi projelerinde kullanmak isteyenler için açık kaynak ekosisteminde bulunuyor. Google’ın amacı, bu modellerle açık çeviri ekosisteminde yeni çözümlerin önünü açmak.

Bir Yorum Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer Yazılar