Yapay Zeka

30/4/2025

Alibaba’dan Qwen3 Adlı Yeni Hibrit Yapay Zeka Model Ailesi

Çinli teknoloji şirketi Alibaba, Pazartesi günü Qwen3 adını verdiği yeni yapay zeka model ailesini tanıttı. Şirket, Qwen3 modellerinin Google ve OpenAI gibi önde gelen rakiplerle yarıştığını ve bazı alanlarda onları geride bıraktığını iddia etti.

Qwen3 serisine ait modellerin büyük bölümü — veya kısa süre içinde tamamı — Hugging Face ve GitHub gibi platformlarda “açık” lisansla indirilebilecek. Modeller, 0,6 milyar parametreden başlayıp 235 milyar parametreye kadar uzanan ölçeklerde sunuluyor. (Parametre sayısı, bir modelin problem çözme yeteneğiyle doğrudan ilişkilidir ve genellikle daha yüksek parametreli modeller daha iyi performans gösterir.)

Alibaba'ya göre Qwen3, "hibrit" bir model ailesi. Modeller karmaşık problemleri çözmek için "düşünme" süresi alabiliyor ya da daha basit sorulara hızlı şekilde yanıt verebiliyor. Böylelikle modeller, OpenAI’nin o3 gibi örneklerinde olduğu gibi, kendilerini denetleme ve doğrulama kapasitesine sahip. Ancak özellik daha yüksek gecikme süresi gerektiriyor.

Qwen ekibi bir blog gönderisinde şunları yazdı: "Düşünen ve düşünmeyen modları kusursuz şekilde entegre ettik ve kullanıcıya düşünme bütçesini kontrol etme esnekliği sunduk. Bu tasarım, görev odaklı bütçelerin daha kolay yapılandırılmasını sağlıyor."

Bazı modeller ayrıca, görevleri alt parçalara ayırarak her birini özel uzman modellere yönlendiren "uzmanlar karışımı (Mixture of Experts - MoE)" mimarisini kullanıyor. Söz konusu yöntem, sorgulara daha verimli yanıtlar üretebilmek için hesaplama kaynaklarını optimize ediyor.

Alibaba, Qwen3 modellerinin 119 dili desteklediğini ve 36 trilyonun üzerinde token içeren bir veri kümesiyle eğitildiğini belirtti. Eğitim verileri; ders kitapları, soru-cevap çiftleri, kod örnekleri, yapay zeka üretimi veriler ve diğer kaynaklardan oluşuyor.

Yapılan bu iyileştirmelerin Qwen3’ün yeteneklerini önceki sürüm olan Qwen2’ye kıyasla önemli ölçüde artırdığı ifade edildi. Qwen3 modelleri, en yeni OpenAI o3 ve o4-mini gibi ileri düzey modellere kıyasla öne çıkmasa da, güçlü performans sergiliyor.

Kodlama yarışmaları için kullanılan Codeforces platformunda, Qwen serisinin en büyük modeli olan Qwen-3-235B-A22B, OpenAI’nin o3-mini ve Google’ın Gemini 2.5 Pro modellerini az farkla geride bıraktı. Ayrıca AIME adlı zorlu matematik benchmark’ında ve problem çözme yeteneğini ölçen BFCL testinde o3-mini’yi geçti. Ancak model henüz kamuya açık değil.

Halihazırda erişime açık olan en büyük model olan Qwen3-32B, Çinli yapay zeka laboratuvarı DeepSeek’in R1 modeli dahil olmak üzere birçok açık ve kapalı kaynaklı modelle rekabet edebilecek düzeyde. Qwen3-32B, OpenAI’nin o1 modelini LiveCodeBench gibi bazı kodlama testlerinde geride bırakıyor.

Alibaba, Qwen3'ün araç kullanma becerileri, talimatlara uyum ve belirli veri formatlarını kopyalama gibi görevlerde de öne çıktığını belirtiyor. Modeller yalnızca indirilebilir formatta değil, aynı zamanda Fireworks AI ve Hyperbolic gibi bulut hizmetleri üzerinden de erişilebiliyor.

Yapay zeka bulut platformu Baseten’in kurucu ortağı ve CEO’su Tuhin Srivastava şunları söyledi: "Qwen3, açık kaynaklı modellerin, OpenAI gibi kapalı sistemlerle eş güdümlü gelişmeye devam ettiğini gösteren bir başka örnek. ABD, Çin’e çip satışlarını sınırlamaya devam ediyor ancak Qwen3 gibi ileri düzey ve açık modeller, ülkede yerel kullanım için kesinlikle devreye alınacaktır. Bu durum, şirketlerin hem kendi araçlarını geliştirdiğini hem de kapalı sistemlerden hazır çözümler satın aldığını yansıtıyor."



Kaynak:
https://techcrunch.com/2025/04/28/alibaba-unveils-qwen-3-a-family-of-hybrid-ai-reasoning-models/