Yapay Zeka
21/7/2025
OpenAI’nin son deneysel modeli, olağanüstü derecede zorlayıcı bir matematik sınavında sergilediği performansla gündeme oturdu. Model, yapay zekanın şimdiye kadarki en zorlu meydan okumalarından birinde, insan seviyesinde başarı gösterdi.
OpenAI teknik ekibinden Alexander Wei, X platformundaki açıklamasında şu sözleri kullandı: “Son @OpenAI deneysel akıl yürütme LLM’imizin, yapay zekadaki uzun süredir devam eden büyük bir hedefi gerçekleştirdiğini paylaşmaktan heyecan duyuyorum: dünyanın en prestijli matematik yarışması olan Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya düzeyinde bir performans.”
Uluslararası Matematik Olimpiyatı (IMO), 1959 yılında Romanya’da başlayan ve günümüzde dünyanın en zor akademik yarışmalarından biri olarak kabul edilen küresel bir organizasyon. İki gün süren yarışmada katılımcılara her biri üç sorudan oluşan dört buçuk saatlik sınavlar veriliyor. IMO’da dereceye giren bazı isimler arasında geometri alanında önemli katkılar sunan Grigori Perelman ve matematiğin en saygın ödülü olan Fields Madalyası sahibi Terence Tao yer alıyor.
Haziran ayında, Terence Tao Lex Fridman’ın podcast’inde yapay zekanın IMO’da yüksek bir puan almasının zor olduğunu söylemiş ve araştırmacılara daha düşük seviyeli yarışmalara odaklanmalarını önermişti. “Daha küçük yarışmalar var. Cevabın uzun bir ispat yerine sadece bir sayı olduğu yarışmalar var.” demişti.
Ancak Alexander Wei, OpenAI’nin son modelinin insanlarla aynı test koşulları altında sorulan altı sorunun beşini doğru yanıtladığını açıkladı. Wei’nin çalışma arkadaşı Noam Brown, modelin sınav sırasında dikkat çeken bir direnç gösterdiğini ifade etti: “IMO soruları, önceki kıyaslamalara göre daha uzun süreli yaratıcı düşünme gerektiriyor. Bu model uzun süre düşünmeye devam ediyor.”
Wei, modelin performansını genel zeka alanında bir sıçrama olarak değerlendirdi. “Modelin başarısı, genel amaçlı pekiştirmeli öğrenmede yeni bir seviyeye ulaşıyor.” dedi. Wei’ye göre bu model, DeepMind’ın yalnızca matematik çözümü için özel olarak geliştirilen AlphaGeometry sisteminden farklı olarak çok daha geniş kapsamlı.
OpenAI CEO’su Sam Altman da konuyla ilgili olarak X platformunda şu açıklamayı yaptı: “Bu, matematik çözen belirli bir formel sistem değil; genel zekaya yönelik ana hedefimizin bir parçası olan bir dil modeli.” Altman, OpenAI’nin kuruluş yıllarına atıf yaparak, “OpenAI’yi ilk kurduğumuzda bu bir hayaldi ama bize çok gerçekçi gelmiyordu; bu, yapay zekanın son on yılda ne kadar ilerlediğinin önemli bir göstergesi.” ifadelerini kullandı.
Altman, bu seviyedeki “altın düzey” yeteneklere sahip bir modelin kamuya açık hâle gelmesinin ise “aylar süreceğini” belirtti.
Söz konusu başarı, yapay zeka teknolojilerinin gelişme hızına dair dikkat çekici bir örnek olarak öne çıkıyor. Wei’nin çalışma arkadaşı Noam Brown, geçen yıl laboratuvarların modelleri değerlendirmek için yalnızca ilkokul seviyesinde matematik kullandığını hatırlattı. Teknoloji milyarderi Peter Thiel ise geçen yıl yaptığı açıklamada, yapay zekanın ABD Matematik Olimpiyatı sorularını çözebilmesi için en az üç yıl gerektiğini öngörmüştü.
Yine de bazı kuşkular sürüyor. Yapay zeka konusundaki eleştirileriyle tanınan Gary Marcus, modelin performansını X platformunda “gerçekten etkileyici” olarak tanımladı. Ancak aynı zamanda modelin nasıl eğitildiği, “genel zeka” kavramının kapsamı, toplum genelindeki faydası ve soru başına düşen maliyet gibi konularda çeşitli sorular sordu. Marcus ayrıca IMO yetkililerinin bu sonuçları henüz bağımsız olarak doğrulamadığını da vurguladı.
Kaynak: https://www.businessinsider.com/openai-gold-iom-math-competition-2025-7