Yapay Zeka Uygulamaları
6/8/2025
OpenAI, salı günü yaptığı açıklamayla, o-serisiyle benzer yeteneklere sahip iki açık-ağırlıklı yapay zeka akıl yürütme modelini tanıttı. Şirket, her iki modelin de geliştirici platformu Hugging Face üzerinden ücretsiz olarak indirilebileceğini duyurdu ve bu modelleri, açık modelleri karşılaştırmaya yönelik çeşitli ölçütlerde yapılan değerlendirmelere göre “son teknoloji ürünü” olarak tanımladı.
Model ailesi, iki farklı boyutta sunuluyor: Daha güçlü olan gpt-oss-120b modeli, tek bir Nvidia GPU üzerinde çalıştırılabiliyor. Daha hafif olan gpt-oss-20b ise 16 GB belleğe sahip sıradan bir dizüstü bilgisayarda çalışabilecek şekilde tasarlandı.
Lansman, OpenAI'nin yaklaşık beş yıl önce piyasaya sürdüğü GPT-2'den sonra yayınladığı ilk "açık" dil modeli olarak kayda geçti.
OpenAI, yaptığı bilgilendirmede, açık modellerinin karmaşık sorguları bulut tabanlı yapay zeka modellerine iletebileceğini ifade etti. TechCrunch'ın daha önce bildirdiği üzere, söz konusu özellik sayesinde, örneğin bir görüntüyü işleyemeyen açık model, OpenAI'nin daha yetenekli kapalı modellerinden biriyle entegre edilebiliyor.
Başlangıçta açık kaynak model geliştirmeye odaklanan OpenAI, son yıllarda daha çok kapalı kaynaklı, tescilli bir yaklaşımı benimsedi. Bahsi geçen strateji, şirketin yapay zeka modellerine erişim sağlayan API hizmetleri üzerinden büyük bir kurumsal gelir elde etmesini sağladı ancak OpenAI CEO’su Sam Altman, ocak ayında yaptığı açıklamada, şirketin açık kaynak teknolojiler konusundaki yaklaşımıyla ilgili olarak “tarihin yanlış tarafında yer aldığını” düşündüğünü ifade etti. Şirket, bugün Çinli yapay zeka laboratuvarlarının baskısıyla karşı karşıya: DeepSeek, Alibaba’nın Qweni ve Moonshot AI, dünyanın en güçlü ve popüler açık modellerinden bazılarını geliştirmiş durumda. (Geçtiğimiz yıla kadar açık yapay zeka alanına öncülük eden Meta, Llama modelleriyle son dönemde bu alanda geride kaldı.)
Temmuz ayında Trump yönetimi, Amerikan değerleriyle uyumlu küresel yapay zeka benimsenmesini teşvik etmek amacıyla, ABD’li yapay zeka geliştiricilerine daha fazla açık kaynaklı teknoloji sunmaları yönünde çağrıda bulundu.
OpenAI, gpt-oss modelleriyle hem geliştiricilerin hem de Trump yönetiminin desteğini kazanmayı hedefliyor. Altman, TechCrunch ile paylaşılan açıklamasında şu sözlere yer verdi: “2015’te yola çıktığımız günden bu yana, OpenAI'nin misyonu tüm insanlık için fayda sağlayan AGI’yi (Genel Yapay Zeka) mümkün kılmaktır. Bu doğrultuda, dünya genelinde herkesin faydalanabileceği, demokratik değerlere dayanan ve Amerika Birleşik Devletleri’nde oluşturulmuş açık bir yapay zeka altyapısı üzerine inşa edilen çözümleri kullanıma sunmaktan heyecan duyuyoruz.”
OpenAI, yeni açık modelini diğer açık-ağırlıklı yapay zeka modelleri arasında lider konuma getirmeyi amaçladı ve şirket, bu hedefe ulaştığını iddia ediyor.
Codeforces adlı rekabetçi kodlama testinde (araçlarla birlikte), gpt-oss-120b ve gpt-oss-20b sırasıyla 2622 ve 2516 puan alarak DeepSeek’in R1 modelini geride bıraktı, ancak o3 ve o4-mini modellerinin gerisinde kaldı.
Humanity’s Last Exam (HLE) adlı, çeşitli konulardaki kitle kaynaklı sorulardan oluşan zorlu bir testte (araçlarla birlikte), modeller sırasıyla %19 ve %17.3 başarı oranı elde etti. Bu sonuçlar da yine o3 modelinin altında kalırken, DeepSeek ve Qwen tarafından geliştirilen lider açık modellerin önüne geçiyor.
Ancak önemli bir fark olarak, OpenAI’nin açık modellerinin, en yeni yapay zeka akıl yürütme modelleri olan o3 ve o4-miniye kıyasla çok daha yüksek oranlarda halüsinasyon ürettiği gözlemlendi.
OpenAI, son zamanlarda geliştirdiği AI modellerinde halüsinasyonların daha da ciddi hale geldiğini belirtiyor. Şirketin yayınladığı teknik belgede şu ifadelere yer veriliyor: “Beklenen bir durum; çünkü daha küçük modeller, büyük öncü modellere kıyasla daha az dünya bilgisine sahiptir ve bu nedenle daha fazla halüsinasyon üretme eğilimindedir.”
PersonQA adlı, bir modelin insanlar hakkında bilgi doğruluğunu ölçen şirket içi testte, gpt-oss-120b soruların %49’unda, gpt-oss-20b ise %53’ünde halüsinasyon üretti. Karşılaştırmak gerekirse, OpenAI’nin o1 modeli %16, o4-mini modeli ise %36 halüsinasyon oranına sahipti.
OpenAI, açık modellerini tescilli modellerine benzer süreçlerle eğittiğini açıkladı. Her iki açık model de mixture-of-experts (MoE) yönteminden faydalanıyor. Bu yöntem, her bir soruda yalnızca sınırlı sayıda parametreyi etkinleştirerek daha verimli çalışmayı sağlıyor. Örneğin, toplamda 117 milyar parametreye sahip gpt-oss-120b modeli, her bir token için yalnızca 5.1 milyar parametreyi etkinleştiriyor.
Şirket ayrıca modellerin eğitiminde yüksek işlem gücüyle çalışan reinforcement learning (RL) yöntemini kullandığını belirtti. Bu, simüle ortamlarda doğru ve yanlışı öğretmek için Nvidia GPU kümeleriyle gerçekleştirilen son eğitim aşamasını ifade ediyor. Aynı yöntem, OpenAI’nin o-serisi modellerinin eğitiminde de kullanılmıştı. Açık modeller de benzer şekilde, yanıtlarını oluştururken daha uzun hesaplama süresi gerektiren bir zincirleme düşünce (chain-of-thought) sürecine sahip.
Bu eğitim yapısı sayesinde, modeller YZ ajanlarını desteklemede oldukça etkili ve yanıt üretim sürecinde web araması yapma veya Python kodu çalıştırma gibi araçları kullanabiliyor. Ancak, OpenAI’nin belirttiğine göre açık modeller yalnızca metin odaklı; yani görüntü ya da ses işleme ve üretme yetenekleri bulunmuyor.
gpt-oss-120b ve gpt-oss-20b, Apache 2.0 lisansı ile yayınlanıyor. Bu lisans, en esnek ve ticari kullanıma en uygun lisanslardan biri olarak kabul ediliyor. Bu sayede işletmeler, OpenAI’nin açık modellerini şirketten izin almadan ya da ücret ödemeden ticarileştirme imkanına sahip.
Ancak AI2 gibi laboratuvarların sunduğu tamamen açık kaynaklı çözümlerin aksine, OpenAI modellerin eğitildiği veri kümelerini paylaşmayacağını açıkladı. Bu karar şaşırtıcı değil; zira halihazırda OpenAI dahil birçok yapay zeka şirketi, modellerini telif hakkı koruması altındaki içeriklerle izinsiz olarak eğitmekle suçlanıyor ve devam eden davalarla karşı karşıya.
Şirket, modellerin güvenlik risklerini değerlendirmek için yayınlamayı birkaç kez erteledi. Yayınladığı teknik belgede OpenAI, modellerin kötü niyetli kişilerce siber saldırılar ya da biyolojik ve kimyasal silah üretimi gibi faaliyetlerde kullanılmak üzere özelleştirilebilme ihtimalini araştırdığını belirtti.
OpenAI ve bağımsız değerlendiriciler tarafından yapılan testler sonucunda, gpt-oss modellerinin biyolojik kapasiteyi sınırlı ölçüde artırabileceği görüldü. Ancak şirket, modellerin, bu alanlarda tehlikeli düzeyde yüksek kapasiteye ulaşabileceğine dair bir kanıt bulmadığını, ince ayar (fine-tuning) yapılmış olsalar bile, bu eşiğe erişemediklerini bildirdi.
OpenAI’nin açık modelleri, mevcut açık modeller arasında en ileri teknolojiye sahip çözümler arasında yer alıyor. Geliştirici topluluğu ise gözünü Çin merkezli DeepSeek’in R2 modeline ve Meta’nın Superintelligence Lab tarafından geliştirilecek yeni açık modele çevirmiş durumda.
Kaynak: https://techcrunch.com/2025/08/05/openai-launches-two-open-ai-reasoning-models/