Yapay Zeka Uygulamaları
6/8/2025
Google’ın yapay zeka destekli dünya modelleme teknolojisi önemli bir güncelleme aldı. Teknoloji devi, özellikle Google DeepMind çatısı altında geliştirdiği Genie 3 adlı en yeni YZ dünya modelini tanıttı. Genie 3, kullanıcıların yalnızca bir metin komutuyla 720p kalitesinde bir 3D dünya üretmesine, bu dünyayı keşfetmesine, çevrede gerçek zamanlı etkileşimler kurmasına ve yeni komutlar vererek ortamı anlık olarak değiştirmesine olanak sağlıyor.
DeepMind tarafından paylaşılan duyuru videosunda da görülebileceği üzere Genie 3, yalnızca statik sahneler üretmekle kalmıyor; aynı zamanda sesli videolar sunarak 8 saniyelik sınırı aşan içerikler üretiyor. Google, sistemin birkaç dakikalık etkileşim süresi sunduğunu ve süreyi “interaction horizon” (etkileşim ufku) olarak tanımlıyor. Kullanıcılar, bu süre boyunca ortamla aktif şekilde etkileşime geçip değişiklikler yapabiliyor.
Genie 3, bir bakıma yapay zeka ile sanal gerçekliğin birleşmesi gibi tanımlanabilir. Kullanıcılar, metinle tanımlanmış bir sahneye yeni öğeler ekleyebiliyor, oluşturulan 3D dünyada gezinebiliyor ve bu dünyaya sürekli müdahalede bulunabiliyor. Yeni sürüm, 2024’ün sonunda tanıtılan Genie 2’nin üzerine ciddi geliştirmeler ekliyor. Google DeepMind tarafından paylaşılan bir grafikte, GameNGen, Genie 2 ve Genie 3 arasındaki ilerleme açık şekilde görülüyor; ayrıca sistem Veo ile de karşılaştırmalı olarak sunuluyor.
Google, blog gönderisinde bazı etkileşimli demoları da kullanıcılarla paylaştı. Demolar arasında karlı bir tepede veya bir müze ortamında, kullanıcıya belirli hedefler verildiği senaryo temelli sahneler yer alıyor. DeepMind tarafından yapılan özet açıklamada şu ifadelere yer veriliyor: “Genie 3, gerçek zamanlı etkileşime izin veren ilk dünya modelimizdir ve aynı zamanda Genie 2’ye kıyasla tutarlılığı ve gerçekçiliği artırır.”
Gazeteci Lance Ulanoff ve diğer kullanıcıların değerlendirmelerine göre Genie 3, bir VR gözlük ile kullanılabilecek potansiyele sahip ve özellikle oyun geliştiricileri için ortam ve karakter prototipleme açısından büyük fayda sağlayabilir. Google ise teknolojiyi, beklendiği üzere, Yapay Genel Zeka’ya (AGI) giden bir adım olarak görüyor. DeepMind’a göre, Genie 3, sınırsız sayıda derinlemesine ortam içerisinde çeşitli yapay zeka ajanlarını eğitmek için büyük bir altyapı sunuyor.
Genie 3’teki bir diğer önemli iyileştirme ise nesne sürekliliği sağlanması. Yayınlanan bir klipte, bir çift kolun mavi boya rulolarıyla duvara boya sürdüğü görülüyor. Kamera yön değiştirdiğinde, mavi boya izlerinin duvarın doğru yerlerinde kalmaya devam ettiği gözlemleniyor. Özellik, Apple’ın visionOS 26 ile başarmayı hedeflediği nesne kalıcılığına benzetilse de, Genie 3 tamamen yapay bir ortam içerisinde çalıştığı için etkileyiciliği daha yüksek olarak değerlendiriliyor.
DeepMind, Genie 3’ün mevcut sürümünün bazı sınırlamalara sahip olduğunu da açıkça belirtiyor. Örneğin, gerçek dünya mekânlarını coğrafi açıdan tam isabetle simüle edemiyor ve etkileşim süresi yalnızca birkaç dakika ile sınırlı. Yine de Genie 2’ye kıyasla sunulan etkileşim süresi ciddi bir ilerleme anlamına geliyor. Kullanıcıların şu anda Genie 3 dünyasına doğrudan giriş yapması mümkün değil. Model, yalnızca sınırlı sayıda test kullanıcısına açılmış durumda. Google, sistemin daha geniş bir kullanıcı kitlesine açılması konusunda henüz en uygun yöntemi belirleme aşamasında.
Henüz Genie 3’le nasıl bir arayüz üzerinden etkileşim kurulacağı netlik kazanmamış olsa da, paylaşılan demolar teknolojinin güçlü potansiyelini ortaya koyuyor. Google, Genie 3’ü yalnızca yapay zeka araştırmaları ve eğitim ortamlarında mı tutacak, yoksa medya üretimi gibi alanlara da mı açacak, şimdilik belli değil fakat beklentiler, kısa süre içinde Genie 4 ya da Genie 3’ün daha geniş bir sürümünün gelmesi yönünde.