Yapay Zeka Uygulamaları
17/11/2025
.png)
Google DeepMind, SIMA’nın yeni nesli olan SIMA 2 için araştırma önizlemesini paylaşarak, Gemini’nin gelişmiş dil ve akıl yürütme kabiliyetleri ile birleşen çok yönlü bir YZ ajanını tanıttı. Yeni sistem, ortamını yalnızca komut alarak değil, aynı zamanda anlayarak, ilişki kurarak ve karmaşık görevlerde bağımsız davranarak önceki sürümün sınırlarını aşan bir yapı sunuyor.
DeepMind’in AlphaFold dahil geniş proje yelpazesinde izlenen yöntemlere benzer şekilde, SIMA'nın ilk sürümü yüzlerce saatlik video oyunu verisi ile eğitilmişti. Mart 2024’te tanıtılan SIMA 1, çok sayıda 3D oyunda temel komutları takip edebilmiş ancak karmaşık görevlerde sadece %31 başarı oranı gösterebilmişti; insan seviyesinin ise %71 olduğu belirtilmişti.

DeepMind kıdemli araştırma bilimcisi Joe Marino, basın toplantısında “SIMA 2, SIMA 1’e göre yeteneklerde büyük bir sıçrama ve gelişim.” ifadelerini kullanarak yeni modelin daha genel bir ajan olduğunu, daha önce karşılaşmadığı ortamlarda karmaşık görevleri tamamlayabildiğini ve kendi deneyimlerinden öğrenerek kendini geliştirme kapasitesine sahip olduğunu vurguladı.
SIMA 2, Gemini 2.5 Flash-Lite modeli tarafından destekleniyor. DeepMind’in tanımladığı şekliyle AGI (genel yapay zeka), farklı alanlara yayılmış geniş becerileri öğrenebilen ve genelleştirme yapabilen sistemleri temsil ediyor.
Araştırmacılar, gerçek ya da sanal dünyayla bir bedene sahipmiş gibi etkileşim kuran “somut ajanların” genel zeka açısından kritik olduğunu belirtiyor. Marino, bir somut ajanın çevresini insan ya da robot gibi gözlemleyip eyleme geçebildiğini, geleneksel arayüz tabanlı sistemlerin ise yalnızca takvim kontrolü ya da kod yürütme gibi soyut işlemler gerçekleştirdiğini söyledi.
DeepMind kıdemli araştırma bilimcisi Jane Wang, SIMA 2’nin oyun oynamanın ötesine geçtiğini belirterek “Olanları anlamasını, kullanıcının ne istediğini kavramasını ve sağduyulu şekilde yanıt verebilmesini istiyoruz; bu aslında oldukça zor.” dedi.
Gemini entegrasyonu, SIMA 2’nin performansını önceki sürümün iki katına çıkararak dili, akıl yürütmeyi ve somut ajan yeteneklerini tek bir modelde birleştirdi. Marino, No Man’s Sky demosunda SIMA 2’nin kayalık bir gezegen yüzeyini tanımladığını ve çevredeki bir acil durum işaretini algılayarak mantıklı adımlar attığını gösterdi.
SIMA 2, Gemini sayesinde içsel akıl yürütme özelliğini de kullanıyor. Marino’nun gösteriminde ajana “olgun domates rengindeki eve yürü” komutu verildiğinde, SIMA 2 önce “olgun domates kırmızıdır, o halde kırmızı eve gitmeliyim” şeklinde düşünerek doğru hedefe yöneldi.
Ajan aynı zamanda emoji tabanlı komutları da çözümlüyor. Marino örneği şöyle açıkladı: “Ona 🪓🌲 şeklinde bir komut verdiğinizde gidip ağaç devirecektir.”
SIMA 2, DeepMind’in fotogerçekçi ortamlar üreten Genie modelinde de doğru nesneleri tanıyıp onlarla etkileşim kurabiliyor. Marino, banklar, ağaçlar ve kelebekler gibi nesnelerin doğru şekilde algılandığını gösterdi.
Kendi kendine gelişim tarafında, SIMA 1 tamamen insan oyun verisiyle eğitilirken SIMA 2, insan verisini yalnızca başlangıç seviyesi için temel alıyor. Yeni ortamlara yerleştirildiğinde, ikinci bir Gemini modeli ajan için yeni görevler üretiyor; ayrı bir ödül modeli ise denemeleri puanlıyor. Böylece SIMA 2 kendi hatalarından öğrenerek insan rehberliği olmadan yeni davranışlar geliştiriyor.
DeepMind’e göre SIMA 2, gerçek dünyada görev yapabilen daha genel amaçlı robotlara geçişte önemli bir basamak. Kıdemli mühendis Frederic Besse, “Gerçek dünyada görev yapacak bir sistemin neye ihtiyaç duyduğunu düşünürsek iki temel bileşen görüyoruz: yüksek seviyede dünyanın anlaşılması ve görevlerin gerektirdiklerinin kavranması, ayrıca mantık yürütme yeteneği.” dedi. SIMA 2'nin daha çok bu yüksek seviyeli anlayışa odaklandığını belirtti.
SIMA 2’nin fiziksel robotlara entegre edilmesi için bir takvim açıklanmadı. DeepMind’in yakın zamanda tanıttığı robotik temel modellerinin farklı şekilde eğitildiği ve SIMA’dan ayrı bir hat olduğu ifade edildi. Jane Wang, hedeflerinin SIMA 2’nin potansiyelini göstermek ve iş birliği fırsatlarını değerlendirmek olduğunu söyledi.