Yazılım

Opus 4.5 ile Anthropic’nin Yazılım Odaklı Yeni Nesil Performansları

yapay zeka dünyasında rekabet hız kesmeden sürüyor; ancak gelişimin kendisi sabit bir unsur olarak duruyor. Anthrop icin Claude Opus 4.5 adlı üst seviye modelini tanıtarak yazılım geliştirme, ajan sistemleri ve bilgisayar kullanımı gibi alanlarda önemli bir güncelleme sunuyor. Şirket, bu sürümün şimdiye kadarki en güçlü teknik kapasiteyle geldiğini ve önceki sürümlerin ötesine geçtiğini belirtiyor.

Opus 4.5 ile Anthropic'nin Yazılım Odaklı Yeni Nesil Performansları

“En iyi” yarışının ritmi hiç düşmüyor: Opus 4.5 özellikle yazılım odaklı değerlendirmelerde öne çıkıyor. SWE-Bench Verified testinde yüzde 80,9 ile şimdiye kadar kaydedilen en yüksek skoru elde eden model, Gemini 3.0 ve GPT‑5.1‑Codex‑Max üzerindeki üstün performansını gösteriyor. Şirket, yalnızca sentetik testlerde değil gerçek dünya görevlerinde de derin araştırma, slayt düzenleme ve elektronik tablo işleme gibi alanlarda belirgin iyileştirmeler yaşandığını kaydediyor.

Opus 4.5 ile Anthropic'nin Yazılım Odaklı Yeni Nesil Performansları

Opus 4.5, Terminal-bench, araç kullanımı testleri tau2-bench ve MCP Atlas gibi değerlendirme çerçevelerinde de üstün çıktı. Genel problem çözme kapasitesi için ARC-AGI 2 ve GPQA Diamond testlerinde de önemli başarılar sergiliyor. Şirket, Claude’ın bilgisayar kullanımı ve elektronik tablo yeteneklerini öne çıkarıyor ve bu becerileri göstermek amacıyla paralel ürünlerle ek çözümler sunuyor. Daha önce pilot aşamada sunulan Claude for Chrome ve Claude for Excel gibi ürünler, Opus 4.5 ile birlikte daha geniş kullanıcı kitlelerine ulaşacak. Chrome uzantısı tüm Max kullanıcılarına, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarına açık olacak.

Opus 4.5 ile Anthropic'nin Yazılım Odaklı Yeni Nesil Performansları

Uzun bağlamlı işlemlerde hafıza yönetiminde yapılan önemli geliştirmeler, uzun sohbetler ya da çok aşamalı görevlerde verimliliği artırıyor. Ayrıca güvenlik tarafında da yeni sürüm, önceki sürümlere göre kötü niyetli komutları ayırt etmede daha dirençli bir çerçeve sunuyor.

Opus 4.5, yakın dönemde pazara çıkan diğer üst düzey modellerle rekabet etmek durumunda kalacak. Öne çıkan rakipler arasında OpenAI’in GPT‑5.1 (12 Kasım’da çıkış) ve Google’un Gemini 3 (18 Kasım’da çıkış) modelleri yer alıyor.

Etiketler :