OpenAI, o3 YZ Akıl Yürütme Modelinin Güçlendirilmiş Sürümü o3-pro'yu Yayınladı

OpenAI, şirketin şu ana kadar sunduğu en yetenekli model olarak tanımladığı o3-pro adlı yeni YZ modelini yayına aldı.

o3-pro, OpenAI’ın yıl içinde tanıttığı o3 akıl yürütme modelinin geliştirilmiş bir versiyonu. Geleneksel YZ modellerinden farklı olarak, akıl yürütme modelleri sorunları adım adım çözerek fizik, matematik ve kodlama gibi alanlarda daha güvenilir performans sergiliyor.

o3-pro, salı günü itibariyle ChatGPT Pro ve Team kullanıcılarına sunuldu ve daha önce kullanılan o1-pro modelinin yerini aldı. OpenAI'ya göre Enterprise ve Edu kullanıcıları ise modele bir hafta sonra erişim sağlayacak. Ayrıca o3-pro, aynı gün öğleden sonra itibariyle OpenAI geliştirici API’sinde de kullanıma açıldı.

API tarafında o3-pro, 1 milyon girdi tokenı için 20 dolar, 1 milyon çıktı tokenı için ise 80 dolar olarak fiyatlandırılıyor. Girdi tokenları modele verilen metni, çıktı tokenları ise modelin bu metne dayanarak ürettiği cevabı temsil ediyor.

1 milyon girdi tokenı, yaklaşık 750.000 kelimeye denk geliyor; bu miktar, "Savaş ve Barış" romanından biraz daha uzun.

OpenAI, güncelleme notunda şu ifadeleri kullandı: "Uzman değerlendirmelerinde, gözden geçirenler her test edilen kategoride ve özellikle bilim, eğitim, programlama, iş dünyası ve yazı yardımı gibi temel alanlarda o3-pro'yu o3'e tercih etti." Ayrıca "o3-pro, anlaşılırlık, kapsam, yönerge takibi ve doğruluk alanlarında da tutarlı şekilde daha yüksek puan aldı." denildi.

OpenAI’a göre o3-pro, çeşitli araçlara erişebiliyor: web araması yapabiliyor, dosyaları analiz edebiliyor, görsel girdiler üzerine akıl yürütebiliyor, Python kullanabiliyor, hafızaya dayalı kişiselleştirilmiş yanıtlar verebiliyor ve daha fazlasını gerçekleştiriyor. Bununla birlikte, OpenAI, o3-pro’nun yanıtlarının o1-pro modeline göre daha uzun sürede tamamladığını da belirtiyor.

o3-pro’nun bazı sınırları da mevcut. ChatGPT'de geçici sohbetler şimdilik devre dışı bırakıldı ve OpenAI bunun teknik bir sorun nedeniyle olduğunu açıkladı. o3-pro ayrıca görsel oluşturamıyor ve OpenAI’n Canvas çalışma alanı özelliği tarafından desteklenmiyor.

Öte yandan OpenAI'nin iç testlerine göre o3-pro, popüler YZ performans ölçülerinde çarpıcı skorlar elde ediyor. Örneğin, matematik becerilerini değerlendiren AIME 2024 testinde o3-pro, Google'ın önde gelen modeli Gemini 2.5 Pro'dan daha yüksek skor elde etti. Ayrıca, doktora seviyesi bilim bilgisini ölçen GPQA Diamond testinde OpenAI’n rakibi Anthropic’in Claude 4 Opus modelini geride bıraktı.

Kaynak:https://techcrunch.com/2025/06/10/openai-releases-o3-pro-a-souped-up-version-of-its-o3-ai-reasoning-model/