AI Günlükleri: Bu Hafta Yapay Zeka Dünyasında Öne Çıkan Gelişmeler ve Yeni Yetenekler
Son dönemde gündelik yaşama hızla nüfuz eden yapay zeka teknolojileri sürekli bir evrim halinde. Bu süreçte kaydedilen gelişmeler dünyayı değiştirme potansiyeli taşıyor ve serimiz AI Günlükleri kapsamında bu değişimin izini sürmeye devam ediyoruz.

yapay zeka Dünyasında Bu Hafta Neler Yaşandı? Bu hafta biraz durgun bir hava görünse de dikkat çekici bazı adımlar atıldı. Görsel düzenleme alanında öne çıkan haber, Google tarafından sunulan Gemini 2.5 Flash Image oldu. nano banana kod adıyla ortaya çıkan bu model, doğal dil komutlarına yanıt vererek fotoğrafları düzenliyor; yüzler, hayvanlar ve karmaşık görseller bozulmadan korunuyor. Gemini 2.5 Flash Image ile bazı işlemler saniyeler içinde tamamlanabiliyor ve piyasadaki önde gelen düzenleme araçlarından biri olarak görünüyor.
Microsoft, Kendi yapay zeka Modellerini Tanıttı OpenAI ile birlikte yol alan Microsoft, kendi yapay zeka birimini kurdu ve MAI-Voice-1 ile MAI-1-preview adlarını taşıyan modellerini tanıttı. Bu modeller şu an Copilot’un bazı araçlarında kullanıma alınmış durumda. MAI-Voice-1, bir dakikalık ses üretimini bir saniyeden kısa sürede gerçekleştirebiliyor ve günlük sorulara anlamlı yanıtlar verebiliyor.

Nvidia, Bugüne Kadar Üretilmiş En Gelişmiş AI GPU’sunu Duyurdu: Blackwell Ultra GB300 Hot Chips 2025 etkinliğinde tanıtılan Blackwell Ultra GB300, çift-die tasarımına sahip ve NV-HBI ile iki GPU’yu tek çipte çalıştırma kapasitesine sahip. 208 milyar transistörlü bu tasarım, TSMC N4P üretim süreciyle üretiliyor ve 288GB’a kadar HBM3E belleği destekliyor. 8 TB/s bellek bant genişliği sağlayan GB300, önceki nesle göre bellek kapasitesinde %50’nin üzerinde artış sunuyor; bu sayede büyük modeller tam bellek üzerinde çalıştırılabiliyor ve uzun bağlam pencereleri mümkün hale geliyor.
OpenAI, En Gelişmiş Konuşma Modelini Tanıttı: gpt-realtime Karmaşık talimatları daha etkili takip eden ve doğal sesler üreten gpt-realtime, yüzde 20 daha ucuz olmasıyla dikkat çekiyor. Yeni modelin piyasaya sürülmesiyle Realtime API üzerinde güncellemeler yapılmış durumda; API artık uzaktan MCP sunucularını, görsel girdileri ve SIP üzerinden yapılan telefon aramalarını destekliyor. Ayrıca geliştiriciler talimatları kaydedip yeniden kullanabiliyor.

ChatGPT, Bir Genç İle İlgili İddialarda Gündeme Geldi ABD’de 16 yaşında bir gencin intiharıyla bağlantılı olarak aile, ChatGPT’nin bu süreçteki rolünü öne sürerek mahkemeye başvurdu. OpenAI, mevcut güvenlik önlemlerinin bazen uzun sohbetlerde yetersiz kalabildiğini kabul etti ve bu sorunun giderilmesi için güncelleme üzerinde çalıştıklarını belirtti. Ayrıca ebeveyn kontrollerinin artırılması için planlar da açıklandı.
Apple, VLM Speed: FastVLM Görsel-dil modelleri üzerinde odaklanan Apple, FastVLM adlı yeni bir modelle sahneye çıktı. 2024 yılında tanıtılan bu model, görsellerle metinleri aynı anda anlayıp yüksek hızda görevler yürütüyor ve WebGPU desteği sayesinde tarayıcı üzerinden gerçek zamanlı çalıştırılabiliyor. Bu, mobil, bulut ve uç cihazlar için optimize edilmiş bir çözüm olarak öne çıkıyor.

Beyinden Esinlenen Yeni yapay zeka: HRM Singapur merkezli Sapien t’lerde geliştirilen ve Hiyerarşik Akıl Yürütme Modeli (HRM) adını taşıyan bu model, insan beyninin işleyişinden ilham alıyor. Üst düzey modül soyut planlama yaparken alt düzey modül ise hızlı ayrıntılı hesaplamaları yürütüyor. Böylece ara adımları yazmadan doğrudan nihai yanıt üretimi mümkün oluyor; bu, zincirleyici akıl yürütme yerine iki modülün eşzamanlı çalışmasıyla sağlanıyor.
Bu Haftanın Öne Çıkan Üretken Yapay Zekaları
- ByteDance tarafından tamamen ücretsiz sunulan USO, kullanıcı tarafından verilen objeyle stil harmonisi oluşturuyor; Ayrıca OmniHuman-1.5, sesli girdileri ve metinleri bir araya getirerek senkronize videolar üretiyor.
- Alibaba’nın Wan2.2-S2V modeli, ses dosyasını temel alıp görüntüden hareketle videolar üretiyor; Sync tarafından yayınlanan lipsync-2-pro ise ses dosyasını istediğiniz videoya ekleyip dudak hareketlerini senkronize ediyor.
- Microsoft’un metin-okunabilir yapay zekası VibeVoice TTS, metni analiz ederek ton ve duyguyu uygun şekilde seslendiriyor; HeyGen tarafından sunulan Avatar IV ile dijital bir avatar oluşturup videolarda kullanmak mümkün hale geliyor.
yapay zeka Dünyasından Kısa Kısa
- xAI, Apple ve OpenAI’ye dava açtı. Elon Musk ise iPhone’a entegre ChatGPT’nin rekabeti engellediğini ve App Store’un rakip yapay zeka uygulamalarını engellediğini savunuyor.
- Meta’nın Superintelligence Labs ekibi, kendi modelleri gelişene kadar Meta AI sohbet botunda Gemini modelini kullanmayı düşünebiliyor; OpenAI modellerinin de çeşitli uygulamalarda kullanımı gündemde.
- Nvidia, yapay zeka talebinin etkisiyle rekor gelir açıkladı: Blackwell çipleri 27 milyar dolarlık satışla veri merkezlerinde öne çıkarken toplam gelir 46,7 milyar doları buldu.
- Meta, yapay zeka ekibini güçlendiren transferlerle dikkat çekmişti; ancak bazı isimlerin bu süreçte Meta AI’dan ayrıldığı belirtiliyor.
- Çin, yapay zeka çip üretimini artırmayı hedefliyor; bağımsızlık yolunda yatırım ve üretim kapasitesi üç katına çıkarılarak dışa bağımlılığın azaltılması planlanıyor.