YZ Modelleri Üniversitelerarası Programlama Yarışmasında İnsanlarla Aynı Kurallarda Yarıştı: GPT-5 Tüm Soruları Çözdü, Gemini İnsanların Çözemediği Problemi Aştı

OpenAI ve Google DeepMind, temel modellerinin insan programcıların önüne geçebileceğini ve kazanabileceğini göstererek büyük dil modellerinin (LLM) karmaşık, daha önce çözülememiş algoritmaları çözebildiğini kanıtladı.

OpenAI’nin GPT-5 modeli ve Google’ın Gemini 2.5 Deep Think sistemi, 2025 Uluslararası Üniversiteler Arası Programlama Yarışması (ICPC) Dünya Finalleri’nde yer aldı. Yarışma, üniversite takımlarını karmaşık algoritmik soruları çözmek için karşı karşıya getiriyor.

Her iki model insan takımlarının yanında doğrudan yarışmasa da, ICPC kurallarına bağlı kalarak ve kurumların gözetiminde katılım sağladı. LLM’ler, bazı insan yarışmacıların çözemediği soruları başarıyla yanıtladı. GPT-5, 12 sorunun tamamını çözerek mükemmel bir skor elde etti; bu da etkinlikte altın madalya kazanmakla eşdeğer bir performans anlamına geliyor. Gemini 2.5 Deep Think, 12 sorunun 10’unu 677 dakikada çözdü. Google DeepMind, blog gönderisinde bu performansın yarışmada genel sıralamada ikinci olabilecek düzeyde olduğunu belirtti.

OpenAI, GPT-5’in ICPC sorularına özel olarak eğitilmediğini vurguladı. Google ise yarışmaya “gelişmiş bir Gemini 2.5 Deep Think versiyonu” ile katıldığını açıkladı.

İnsan yarışmacılar arasında altın madalya kazananlar, St. Petersburg Devlet Üniversitesi, Tokyo Üniversitesi, Beijing Jiaotong Üniversitesi ve Tsinghua Üniversitesi oldu. Harvard ve MIT ise en iyi Amerikan üniversiteleri olarak gümüş madalya seviyesinde yer aldı. Hiçbir insan takımı 12/12 skoruna ulaşamadı.

ICPC, her yıl binlerce katılımcıyı çeken prestijli bir yarışma. 2025 Dünya Finalleri’nde en az 103 ülkeden 139 üniversite yer aldı. Finalde yarışmacılar, aynı algoritmik sorunları beş saat içinde çözmekle yükümlü. Sıralama, kimin hangi soruları çözdüğüne ve ne kadar sürede tamamladığına göre belirleniyor.

OpenAI, X’te yayımladığı gönderide şunları yazdı: “ICPC’nin yerinde YZ kategorisinde resmi olarak yarıştık. Tüm on iki problemi çözmek için aynı 5 saatlik süre sınırına tabiydik. Çözümlerimiz ICPC Dünya Finalleri Yerel Hakemi’ne sunuldu ve Dünya Şampiyonası başvurularıyla eşzamanlı ve aynı şekilde değerlendirildi. Soruları aynı PDF formatında aldık ve akıl yürütme sistemi hangi yanıtların gönderileceğine karar verdi, hiçbir özel test düzenlemesi yapılmadı. 12 sorudan 11’inde ilk yanıt doğruydu. En zorlu problemde ise 9. denemede başarıya ulaştık. Dikkat çekici olan, en iyi insan takımının 11/12 yapabilmiş olmasıdır.”

Google ise farklı bir ayrıntı paylaştı: Gemini’nin “ilk 45 dakikada sekiz problemi, üç saat içinde iki problemi daha çözdüğünü” açıkladı. Google ayrıca Gemini’nin, üniversite takımlarının hiçbiri tarafından çözülemeyen bir problemi başarıyla tamamladığını duyurdu. Problem, sıvının boru hatları boyunca dağıtılmasına dair bir yöntem bulmayı gerektiriyordu. Google açıklamasında “Gemini, her rezervuara diğerlerine kıyasla ne kadar öncelik verilmesi gerektiğini temsil eden bir ‘öncelik değeri’ atadı. Öncelik değerleri belirlendiğinde, boruların en iyi düzenlemesi dinamik programlama algoritmasıyla bulunabiliyordu. Gemini, minimax teoremini uygulayarak orijinal problemin, akışın en kısıtlı hale geldiği öncelik değerlerini bularak çözülebileceğini fark etti. Öncelik değerleri ile optimal akışlar arasındaki ilişkiyi kullanarak, iç içe geçmiş üçlü aramalarla en uygun öncelik değerlerini kısa sürede belirledi ve C Problemini çözdü.” ifadelerini kullandı.

Büyük dil modellerinin genel bilgi sorularını çözebildiği uzun süredir biliniyor. Ancak ICPC’de sergilenen performans, daha karmaşık matematik problemleri ve rekabetçi bir kodlama ortamında insanları geride bırakabildiklerini ortaya koydu. Fark bir süredir daralıyordu. 2025’in başlarında Google, Gemini’nin Uluslararası Matematik Olimpiyatı’nda altın madalya kazandığını duyurmuştu. Başarı, modellerin birkaç ay önce FrontierMath testinde karmaşık matematik problemlerini çözememesinin ardından geldi.

Elbette her kurumsal kullanım alanı dünyanın en zor programlama sorularını çözebilecek bir modele ihtiyaç duymuyor ancak işletmelerin giderek daha karmaşık iş akışlarını YZ sistemlerine devretmesi ve gelişmiş YZ analizlerine yönelmesi, güçlü kodlama ve matematik becerilerine sahip LLM’leri değerli kılıyor. Aynı zamanda modellerin soyut düşünme ve yaratıcı problem çözme yeteneklerini sergilemesi, gelecekte kurumsal sorunların çözümünde faydalı olabilecek potansiyeli ortaya koyuyor.

Pek çok uzman, modellerin bu düzeyde akıl yürütme ve problem çözme kapasitesi sergilemesinin yapay genel zekaya (AGI) doğru atılmış önemli bir adım olduğunu düşünüyor. İnsan akıl yürütmesi ile LLM’ler arasındaki farkın bir programlama yarışması aracılığıyla kapanması, modellerin bu yolda ilerlediğini gösteriyor.

‍

Kaynak: https://venturebeat.com/ai/google-and-openais-coding-wins-at-university-competition-show-enterprise-ai

İlginizi Çekebilir

Yapay Zeka Uygulamaları

Oct 2025

OpenAI’nin Müzik Üretebilen Yapay Zeka Aracı Üzerinde Çalıştığı Bildirildi

Yapay Zeka Uygulamaları

Oct 2025

Elon Musk’ın Grokipedia’sı Erişime Açıldı: Sayfaların Bir Kısmı Wikipedia’dan Kopyalanmış Görünüyor

Yapay Zeka Uygulamaları

Oct 2025

Suudi Girişim Humain, Yeni Yapay Zeka Tabanlı İşletim Sistemini Tanıtmaya Hazırlanıyor

Yapay Zeka Uygulamaları

Oct 2025

WWE, Hikaye Yazımında Yapay Zeka Kullanacağını Açıkladı

Yapay Zeka Uygulamaları

Oct 2025

Google’ın Gemini’si Artık Sizin için Sunum Hazırlayacak

Bu Websitesi'nin Dönüşmleri

Pinetent Digital Agency

YZ Modelleri Üniversitelerarası Programlama Yarışmasında İnsanlarla Aynı Kurallarda Yarıştı: GPT-5 Tüm Soruları Çözdü, Gemini İnsanların Çözemediği Problemi Aştı

İlginizi Çekebilir

OpenAI’nin Müzik Üretebilen Yapay Zeka Aracı Üzerinde Çalıştığı Bildirildi

Elon Musk’ın Grokipedia’sı Erişime Açıldı: Sayfaların Bir Kısmı Wikipedia’dan Kopyalanmış Görünüyor

Suudi Girişim Humain, Yeni Yapay Zeka Tabanlı İşletim Sistemini Tanıtmaya Hazırlanıyor

WWE, Hikaye Yazımında Yapay Zeka Kullanacağını Açıkladı

Google’ın Gemini’si Artık Sizin için Sunum Hazırlayacak

Kategoriler

Kurumsal

En Önce Sizin Haberiniz Olsun!