Yapay Zeka
29/1/2025
Viral yapay zeka şirketi DeepSeek, OpenAI’nin DALL-E 3 modelini geride bırakabileceğini iddia ettiği, yeni bir çok modlu yapay zeka modeli ailesi olan Janus-Pro’yu tanıttı. Bu yeni model ailesi, hem analiz hem de yeni görüntüler oluşturma yeteneğiyle dikkat çekiyor. Hugging Face platformundan indirilebilen modeller, 1 milyar ile 7 milyar parametre arasında değişen boyutlara sahip. Parametreler, yapay zeka modellerinin problem çözme kapasitesini belirleyen temel unsurlardan biri ve genellikle daha fazla parametreye sahip modeller, daha az parametreye sahip olanlara göre daha iyi performans sergiliyor.
Janus-Pro modelleri, MIT lisansı altında sunuluyor. Bu, modellerin ticari olarak kullanılmasında herhangi bir sınırlama olmadığı anlamına geliyor. DeepSeek, Janus-Pro’yu “yeni bir otoregresif çerçeve” olarak tanımlıyor ve modelin hem küçük boyutlu görüntüleri analiz edebildiğini hem de yüksek doğrulukla yeni görüntüler üretebildiğini belirtiyor. Şirkete göre, Janus-Pro ailesinin en büyük modeli olan Janus-Pro-7B, GenEval ve DPG-Bench gibi iki önemli yapay zeka değerlendirme kriterinde, OpenAI’nin DALL-E 3 modelini ve diğer birçok popüler modeli geride bıraktı. Bu modeller arasında PixArt-alpha, Emu3-Gen ve Stability AI’nin Stable Diffusion XL modelleri de bulunuyor.
Bununla birlikte, Janus-Pro modellerinin çoğu, yalnızca 384 x 384 çözünürlüğe kadar olan küçük boyutlu görüntüleri analiz edebiliyor. Ancak, modellerin kompakt boyutları göz önüne alındığında elde edilen performans oldukça etkileyici. DeepSeek, Hugging Face üzerinde yaptığı bir paylaşımda şunları belirtti:
“Janus-Pro, önceki birleşik modelleri geride bırakıyor ve görev odaklı modellerin performansını eşitliyor veya aşıyor. Janus-Pro’nun basitliği, yüksek esnekliği ve etkinliği, onu bir sonraki nesil birleşik çok modlu modeller için güçlü bir aday haline getiriyor.”
DeepSeek, büyük ölçüde High-Flyer Capital Management adlı bir nicel ticaret firması tarafından finanse edilen bir Çin yapay zeka laboratuvarı. Şirket, bu hafta chatbot uygulamasının Apple App Store listelerinde zirveye yerleşmesiyle dikkatleri üzerine çekti. Janus-Pro modelleri, işlem gücü açısından verimli bir şekilde eğitildi ve bu durum, hem Wall Street analistleri hem de teknoloji uzmanları arasında büyük bir tartışma başlattı. Birçok uzman, ABD’nin yapay zeka yarışındaki liderliğini koruyup koruyamayacağını ve yapay zeka çiplerine olan talebin devam edip etmeyeceğini sorguluyor.
DeepSeek’in yeni modelleri, ABD’nin küresel yapay zeka piyasasındaki konumunu güçlendirmek için sadece donanım yatırımlarına değil, daha geniş kapsamlı bir stratejiye ihtiyaç duyabileceğini gösteriyor. Janus-Pro ailesi, yapay zeka dünyasında dikkat çeken bir dönüm noktası olarak görülüyor.