Qwen3.5 Small Serisi: Cepte Yapay Zeka Taşınıyor — Qwen3.5-9B ve 4B ile Yerel İşletim

Qwen3.5 Small Serisi: Cepte Yapay Zeka Taşınıyor — Qwen3.5-9B ve 4B ile Yerel İşletim

Çinli teknoloji devleri arasında yapay zeka rekabeti sürerken Alibaba’nın Qwen ekibi, Qwen3.5 Small Model Series ile dikkat çekti. Seri, yalnızca yüksek performans iddiası sunmakla kalmıyor; aynı zamanda düşük donanım gereksinimleriyle de öne çıkıyor. Özellikle 2B sürümünün iPhone 17 Pro Max’te yerel olarak çalıştığına dair paylaşımlar, 4B sürümünün Reddit’te cihaz üzerinde çalıştığını gösteren kanıtlarla destekleniyor. Boyutlarına göre daha küçük modellerin bile güçlü çıktılar verebildiği belirtiliyor; hatta Poco F5 gibi android cihazlarda da yerel kullanım mümkün görünmekte. Bu gelişme, yapay zekanın gerçekten “cihaza inmesi” yönündeki dönüşümün işaretçisi olarak değerlendiriliyor. Bulut bağımlılığını azaltan, API anahtarı gerektirmeyen ve internet olmadan çalışabilen bir büyük dil modelinin doğrudan telefon içerisinde görev yapabildiği vurgulanıyor.

Qwen3.5 Small Serisi: Cepte Yapay Zeka Taşınıyor — Qwen3.5-9B ve 4B ile Yerel İşletim

Dört model, dört farklı kullanım senaryosu olarak tanıtılan Qwen3.5 Small ailesi, Qwen3.5-0.8B, 2B, 4B ve 9B sürümlerini kapsıyor. “tiny” ve “fast” olarak adlandırılan bu modeller, batarya tüketiminin kritik olduğu edge cihazlar ve mobil sistemler için optimize edildi. 4B sürümü ise 262.144 token’lık yerel bağlam penceresiyle hafif görevler için güçlü bir çok modlu temel sunuyor. Ailenin en güçlü üyesi olan Qwen3.5-9B, kompakt bir akıl yürütme modeli olarak konumlandırılıyor ve üçüncü taraf testlerinde ABD merkezli rakiplerini geride bırakıyor. Alibaba’nın paylaştığı veriler, 9B’nin açık kaynaklı gpt-oss-120B modelini bazı karşılaştırmalarda geçmeyi başardığını ve bunun yaklaşık 13,5 kat daha küçük parametre ölçeğiyle mümkün olduğunu gösteriyor.

Qwen3.5 Small Serisi: Cepte Yapay Zeka Taşınıyor — Qwen3.5-9B ve 4B ile Yerel İşletim

Qwen3.5 Small serisinin temelinde standart Transformer yaklaşımını aşan bir mimari yatıyor. Gated Delta Networks (daha verimli doğrusal dikkat mekanizması) ile seyrek Mixture-of-Experts (MoE) birleşiminden oluşan hibrit yapı, bellek duvarı sorununu hafifletmeyi amaçlıyor. Böylece çıktı hızı artırılıyor ve gecikme süresi düşüyor; yalnızca gereken bölümler aktivize edildiği için işlem verimliliği yükseliyor. Ayrıca seri, doğal çok modlu eğitim yaklaşımını benimsiyor; görsel kodlayıcı arkaya eklenmiyor, bu da 4B ile 9B’nin arayüz okuma, videoda nesne sayma gibi görevlerde önceki nesillere göre daha üst düzey performans gösterdiğini ifade ediyor.

Qwen3.5 Small Serisi: Cepte Yapay Zeka Taşınıyor — Qwen3.5-9B ve 4B ile Yerel İşletim

9B ve 4B sürümleri çok modlu algılamada ve ileri akıl yürütmede kendi segmentinin ötesine geçebiliyor. Bu modellerin, parametre sayısı kendisinden çok daha yüksek olan rakiplerine karşı üstünlük kurduğu belirtiliyor. Özellikle video anlama ve altyazılı analiz alanlarında 9B’nin Google’ın hafif çözümleriyle rekabet edebildiği dile getiriliyor. Geliştiriciler, 2B ve 4B modellerini mobil uygulamalar için adeta bir “oyun değiştirici” olarak nitelendiriyor ve tarayıcıda da çalışabildiğine dair paylaşımlar dolaşıyor. Böylece uç cihazlarda da yüksek işlem gücü gerektiren görevlerin mümkün olduğuna işaret ediliyor.

Serinin lisansı ise Apache 2.0 altında küresel kullanıcılar için açıklandı; ticari kullanım, değişiklik yapma ve yeniden dağıtım gibi haklar telif ücreti olmadan sunuluyor. Bu noktalar, yapay zekanın uç cihazlarda uygulanabilirliğine dair önemli bir kilometre taşı olarak değerlendiriliyor.

Bir Yorum Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer Yazılar