OpenAI, ChatGPT’ye Genel Amaçlı Bir Yapay Zeka Temsilcisi Ekledi: Bugüne Kadar Geliştirdikleri En Güçlü Temsilci

OpenAI, ChatGPT platformuna yeni bir genel amaçlı yapay zeka temsilcisi (agent) entegre ettiğini duyurdu. Şirket, bu temsilcinin kullanıcılar adına çok çeşitli bilgisayar tabanlı görevleri otomatik olarak tamamlayabileceğini belirtiyor. OpenAI’ye göre temsilci; kullanıcı takvimlerinde gezinebiliyor, düzenlenebilir sunumlar ve slaytlar oluşturabiliyor, aynı zamanda kod çalıştırabiliyor.

"ChatGPT agent" adı verilen bu yeni araç, OpenAI’nin daha önce geliştirdiği temsilci sistemlerinin birçok özelliğini bir araya getiriyor. Örneğin, Operator aracının web sitelerinde gezinme yeteneği ile Deep Research’ün onlarca siteden elde ettiği bilgileri sentezleyip kısa araştırma raporları üretme yetisi, bu sistemin temelini oluşturuyor. OpenAI, kullanıcıların temsilciyle yalnızca doğal dilde yazılmış istemler aracılığıyla iletişim kurabileceğini belirtiyor.

Yeni araç, Perşembe günü OpenAI’nin Pro, Plus ve Team abonelik planlarına sahip kullanıcılar için kullanıma sunulacak. Kullanıcılar, temsilciyi etkinleştirmek için ChatGPT araç menüsünden “agent mode” (temsilci modu) seçeneğini kullanabilecek.

OpenAI, ChatGPT agent’i tanıtarak ChatGPT’yi yalnızca sorulara yanıt veren bir sohbet botundan, kullanıcı adına eylem alabilen ve görev üstlenebilen bir ürün haline dönüştürme yolunda en cesur adımını atmış oldu. Son yıllarda, OpenAI, Google ve Perplexity gibi Silikon Vadisi merkezli şirketler, kullanıcılar için görevleri yerine getirebilecek yapay zeka temsilcileri sunma hedefiyle birçok araç tanıttı. Ancak, bu temsilcilerin erken sürümleri karmaşık görevlerde yetersiz kalmış, teknoloji liderlerinin çizdiği vizyonları karşılamakta zorlanmıştı.

OpenAI ise yeni ChatGPT agent’in, önceki sürümlerine göre çok daha yetenekli olduğunu vurguluyor.

Yeni temsilci, ChatGPT bağlayıcılarına erişim sağlayarak, kullanıcıların Gmail ve GitHub gibi uygulamaları bağlamasına olanak tanıyor. Böylece temsilci, kullanıcı istemleriyle ilgili gerekli bilgileri bu platformlardan toplayabiliyor. OpenAI ayrıca, ChatGPT agent’in bir terminale erişimi olduğunu ve belirli uygulamalara API aracılığıyla bağlanabildiğini ifade ediyor.

OpenAI, kullanıcıların temsilciyi; “dört kişilik Japon kahvaltısı için malzeme planlamak ve satın almak” veya “üç rakibi analiz edip bir sunum hazırlamak” gibi çok adımlı, karmaşık görevler için kullanabileceğini belirtiyor. Bu tür görevler, temsilcinin web sitelerinde gezinmesini, eylem planı oluşturmasını ve araçları kullanmasını gerektiriyor. Bu düzeyde çok yönlü yetenekler, OpenAI’nin daha önceki temsilci sistemlerinde sunulmamıştı.

OpenAI, temsilciyi destekleyen modelin birçok benchmark testinde en güncel performansı sunduğunu bildiriyor.

Şirketin açıklamasına göre, ChatGPT agent modeli, farklı konulardan binlerce sorudan oluşan zorlu “Humanity’s Last Exam” testinde %41,6 başarı oranına (pass@1) ulaştı. Bu oran, OpenAI’nin önceki modelleri olan o3 ve o4-mini’nin aldığı puanın yaklaşık iki katı.

Zorluk seviyesi en yüksek matematik testlerinden biri olan FrontierMath benchmark’ında ise, terminal gibi araçlara erişim sağlandığında ChatGPT agent modeli %27,4’lük başarı elde etti. Aynı testte önceki en yüksek başarı oranı, yalnızca %6,3 ile o4-mini modeline aitti.

OpenAI, temsilciyi geliştirirken güvenlik konusuna özel önem verildiğini de vurguluyor. Şirket, bu ürünün bazı yeni yetenekler taşıdığı ve kötü niyetli kişiler tarafından potansiyel olarak istismar edilebileceği için güvenlik risklerine karşı önlem aldıklarını ifade ediyor. OpenAI, daha önce temsilci yapılarının kötüye kullanıldığında daha tehlikeli yetenekler sunabileceği konusunda uyarılarda bulunmuştu.

OpenAI, ChatGPT agent için yayımladığı güvenlik raporunda, modeli biyolojik ve kimyasal silahlar alanında “yüksek yetenekli” (high capability) olarak sınıflandırdığını belirtti. Bu sınıflandırma, OpenAI’nin Hazırlık Çerçevesi’nde, modelin “ağır zarara yol açabilecek mevcut yolları güçlendirme potansiyeline sahip olması” anlamına geliyor. Şirketin elinde bu yönde doğrudan bir kanıt bulunmasa da, ihtiyatlı davranmak amacıyla yeni güvenlik önlemleri devreye alındı.

Güvenlik önlemleri arasında, temsilciyle etkileşim sırasında gerçek zamanlı olarak çalışan bir izleme sistemi bulunuyor. OpenAI, temsilciye girilen her istem üzerinde bir sınıflandırıcı çalıştırdıklarını, istemin biyoloji ile ilgili olup olmadığını belirlediklerini açıkladı. Eğer istem biyolojiyle ilgiliyse, temsilcinin ürettiği yanıt ikinci bir denetleyici sistemden geçirilerek içeriğin biyolojik tehdit oluşturup oluşturmadığı kontrol ediliyor.

Ayrıca OpenAI, ChatGPT agent için hafıza özelliğini devre dışı bıraktı. ChatGPT’nin diğer bölümlerinde yer alan özellik, sohbet geçmişindeki bilgileri hatırlayarak yeni yanıtlar üretmesini sağlıyordu. Ancak şirket, kötü niyetli kullanıcıların bu özelliği temsilcide prompt injection saldırıları yoluyla hassas verileri sızdırmak için kullanabileceği ihtimaline karşı özelliği kapattı. OpenAI, bu özelliğin ileride tekrar eklenebileceğini belirtiyor.

ChatGPT agent etkileyici görünse de, gerçek dünyadaki performansı henüz tam anlamıyla net değil. Şimdiye kadar piyasaya sürülen temsilci teknolojilerinin gerçek dünyadaki etkileşimlerde genellikle kırılgan olduğu görüldü. Yine de OpenAI, bu kez daha güçlü ve söz verilen yetenekleri sunabilecek bir model geliştirdiklerini söylüyor.

Kaynak: https://techcrunch.com/2025/07/17/openai-launches-a-general-purpose-agent-in-chatgpt/