En Son Haberler

23/12/2024

OpenAI, Yeni o3 ve o3-mini Modellerini Tanıttı.

OpenAI, yaklaşık iki hafta süren duyuruların ardından 12 Days of OpenAI canlı yayın serisini yeni nesil frontier modeli o3'ün önizlemesiyle tamamladı. OpenAI CEO'su Sam Altman, YouTube'daki duyuru sırasında modelin adının "o3" olduğunu açıkladı ve bu ismin, Telefónica’daki (Avrupa'daki O2 hücresel ağının sahibi) arkadaşlarına ve OpenAI'nin isimlendirme konusundaki geleneksel zayıflığına saygıdan kaynaklandığını belirtti. Ancak, o3 henüz genel kullanıma sunulmamış durumda. Şu an için OpenAI, o3'ü ilk olarak güvenlik testlerinde yardım isteyen araştırmacıların kullanımına sunuyor.

Altman ayrıca o3-mini'nin de duyurusunu yaptı ve bu modelin Ocak ayında piyasaya sürülmesinin planlandığını belirtti. o3, selefine göre önemli performans iyileştirmeleri sunuyor. Örneğin, bu yılki American Invitational Mathematics Examination’da o3, %96,7 doğruluk oranı elde etti. Bu oran, önceki model o1’in %83,3’lük performansından oldukça yüksek. OpenAI'nin araştırmadan sorumlu kıdemli başkan yardımcısı Mark Chen, o3'ün "genellikle sadece bir soruyu kaçırdığı" anlamına geldiğini belirtti. Bu kadar yüksek bir doğruluk oranı elde etmesi nedeniyle, OpenAI, o3'ü daha zor testlerle karşılaştırmaya karar verdi.

Bunlardan biri, yapay zekanın yerinde sezme ve öğrenme yeteneğini test eden bir ölçüt olan ARC-AGI'dir. ARC Prize’a göre, ARC-AGI'yi başarıyla geçebilen bir yapay zeka sistemi, yapay genel zekaya doğru önemli bir kilometre taşını temsil edecektir. Ancak, 2019'dan bu yana hiçbir yapay zeka modeli ARC-AGI’yi geçmeyi başaramamıştı. Test, insanlara sezgisel olarak çözebilecekleri girdi-çıktı soruları sunuyor. o3, düşük işlem gücüyle bu testten %75,7 puan alırken, ek işlem gücüyle bu oranı %87,5'e çıkardı. ARC Prize Foundation Başkanı Greg Kamradt, insan performansının genellikle %85 civarında olduğunu ve o3’ün bu seviyeyi aşmasının önemli bir başarı olduğunu belirtti.

OpenAI ayrıca o3-mini'yi de tanıttı. Bu yeni model, Adaptive Thinking Time API’sini kullanarak üç farklı akıl yürütme modu sunuyor: Düşük, Orta ve Yüksek. Bu, kullanıcıların bir soruya yanıt verilmeden önce modelin ne kadar süre "düşüneceğini" ayarlamalarına olanak tanıyor. Grafiklere göre, o3-mini, OpenAI’nin önceki o1 akıl yürütme modeliyle benzer sonuçlar elde edebiliyor, ancak daha düşük hesaplama maliyeti ile. o3-mini, o3'ün öncesinde genel kullanıma sunulacak ve böylece daha geniş bir kullanıcı kitlesine hitap edecek.

Bu duyurular, OpenAI'nin yeni yapay zeka modelleriyle daha ileri seviyede hesaplama ve akıl yürütme kapasitesine ulaşma amacında olduğunu gösteriyor. o3'ün sunduğu performans ve başarılar, yapay zeka sistemlerinin gelecekteki gelişiminde önemli bir adım olarak değerlendiriliyor.