Yapay Zeka
21/1/2025
OpenAI, bilgisayarınızı kontrol edip sizin adınıza eylemler gerçekleştirebilen bir yapay zeka aracını piyasaya sürmeye hazırlanıyor olabilir. Yaklaşan yapay zeka ürünlerini doğru bir şekilde sızdırmasıyla tanınan yazılım mühendisi Tibor Blaho, OpenAI'nin uzun süredir söylentileri dolaşan Operator aracının kanıtlarını ortaya çıkardığını iddia ediyor. Bloomberg de dahil olmak üzere yayınlar daha önce, kod yazma ve seyahat rezervasyonu gibi görevleri otonom olarak yerine getirebilen “ajan” bir sistem olduğu söylenen Operator hakkında haber yapmıştı. The Information'a göre, OpenAI, Operator'un piyasaya sürüleceği ay olarak Ocak ayını hedefliyor. Bu hafta sonu Blaho tarafından ortaya çıkarılan kod, bu rapora güven katıyor.
Blaho'ya göre, OpenAI'nin macOS için ChatGPT istemcisi, şimdilik gizli olan “Operatörü Değiştir” ve “Operatörden Çıkmaya Zorla” kısayollarını tanımlamak için seçenekler kazandı. Blaho, OpenAI'nin web sitesinde Operator'a referanslar eklediğini, ancak bu referansların henüz herkes tarafından görülemediğini söyledi. Blaho'ya göre, OpenAI'nin sitesinde Operator'ün performansını bilgisayar kullanan diğer yapay zeka sistemleriyle karşılaştıran henüz kamuya açık olmayan tablolar da yer alıyor. Tablolar yer tutucu olabilir. Ancak rakamlar doğruysa, göreve bağlı olarak Operator'ün %100 güvenilir olmadığını gösteriyor. Gerçek bir bilgisayar ortamını taklit etmeye çalışan OSWorld'de, “OpenAI Computer Use Agent (CUA)” - muhtemelen Operator'a güç veren YZ modeli - %38.1 puan alarak Anthropic'in bilgisayar kontrol modelinin önünde yer aldı ancak insanların aldığı %72.4 puanının oldukça gerisinde kaldı. OpenAI CUA, bir YZ'nin web sitelerinde gezinme ve etkileşimde bulunma becerisini değerlendiren WebVoyager'da insan performansını aşıyor. Ancak sızdırılan kıyaslamalara göre model, bir başka web tabanlı kıyaslama olan WebArena'da insan seviyesindeki puanların gerisinde kalıyor. Sızıntıya inanılacak olursa, Operator bir insanın kolayca gerçekleştirebileceği görevlerde de zorlanıyor. Operatör'e bir bulut sağlayıcısına kaydolma ve bir sanal makine başlatma görevi verilen bir testte, Operatör zamanın yalnızca %60'ında başarılı oldu. Bir Bitcoin cüzdanı oluşturma görevi verilen Operatör, zamanın yalnızca %10'unda başarılı oldu.
OpenAI'nin yapay zeka aracıları alanına yakın zamanda girmesi, yukarıda bahsedilen Anthropic, Google ve diğerleri de dahil olmak üzere rakiplerin yeni ortaya çıkan segment için oyun oynamasıyla birlikte geliyor. YZ aracıları riskli ve spekülatif olabilir, ancak teknoloji devleri şimdiden onları YZ'deki bir sonraki büyük şey olarak lanse ediyor. Analist firması Markets and Markets'e göre, YZ aracıları pazarı 2030 yılına kadar 47,1 milyar dolar değerinde olabilir. Günümüzde ajanlar oldukça ilkeldir. Ancak bazı uzmanlar, teknolojinin hızla gelişmesi durumunda güvenlikleri konusunda endişelerini dile getirdiler. Sızdırılan tablolardan biri, Operator'ün, sistemin “yasadışı faaliyetler” gerçekleştirmesini ve “hassas kişisel verileri” aramasını sağlamaya çalışan testlerde iyi performans gösterdiğini gösteriyor. Operator'un uzun geliştirme döngüsünün nedenleri arasında güvenlik testlerinin de yer aldığı bildiriliyor. OpenAI kurucu ortağı Wojciech Zaremba, kısa süre önce yayınladığı bir X gönderisinde, güvenlik önlemlerinden yoksun olduğunu iddia ettiği bir ajanı piyasaya sürdüğü için Anthropic'i eleştirdi. Zaremba konuyla ilgili, “OpenAI'nin benzer bir sürüm yapması halinde alacağı olumsuz tepkileri hayal edebiliyorum.” diye yazdı. OpenAI'nin, eski personeli de dahil olmak üzere bazı yapay zeka araştırmacıları tarafından, teknolojisini hızla ürünleştirmek adına güvenlik çalışmalarına önem vermediği iddiasıyla eleştirildiğini belirtmek gerekir.