Google’ın Yeni Yapay Zeka Modeli Web Tarayıcısını İnsan Gibi Kullanıyor

Google, Gemini 2.5 Computer Use adlı yeni yapay zeka modelini tanıttı. Model, bir web tarayıcısı üzerinden kullanıcıların isteklerini anlayarak form doldurma veya gönderme gibi görevleri yerine getirebiliyor. Şirket, modelin “görsel anlama ve akıl yürütme yetenekleri” sayesinde tarayıcı tabanlı görevleri insanlar gibi yapabildiğini açıkladı.

Google’a göre Gemini 2.5, API’si bulunmayan ya da doğrudan bağlantı imkanı olmayan arayüzlerde kullanılabiliyor. Söz konusu özellik, özellikle arayüz testleri veya yalnızca insanlar için tasarlanmış platformlarda gezinmek için öne çıkıyor. Benzer model versiyonları daha önce AI Mode ve kendi kendine görev yürütebilen Project Mariner araştırma prototipinde de kullanılmıştı.

Google’ın açıklaması, OpenAI’nin yıllık Dev Day etkinliğinde ChatGPT Agent uygulamalarını duyurmasının hemen ardından geldi. Böylece teknoloji devleri arasında tarayıcı ve arayüz tabanlı otonom görevler konusunda rekabet daha da kızışmış oldu. Öte yandan Anthropic de geçen yıl Claude modeliyle benzer bir “computer use” özelliğini tanıtmıştı.

Şirket, hızlandırılmış demo videoları paylaşarak aracın işleyişini gösterdi ve modelin “birçok web ve mobil ölçütünde önde gelen alternatiflerden daha iyi performans” sunduğunu belirtti. Google, sistemin yalnızca tarayıcı üzerinde çalıştığını, henüz “masaüstü işletim sistemi seviyesinde kontrol için optimize edilmediğini” vurguladı. Şimdilik model, tarayıcı açma, metin yazma, sürükle-bırak gibi 13 farklı eylemi destekliyor.

Gemini 2.5 Computer Use, geliştiriciler için Google AI Studio ve Vertex AI üzerinden erişime açıldı. Ayrıca Browserbase platformunda da canlı bir demo bulunuyor. Kullanıcılar, burada modelin “Okey Plus oyununu başlat” veya “Ekşi Sözlük’te gündemdeki başlıklara göz at” gibi görevleri yerine getirişini izleyebiliyor.

Kaynak: https://www.theverge.com/news/795463/google-computer-use-gemini-ai-model-agents