Yapay Zeka
28/1/2025
Teknoloji dünyasında dikkatler Çin’in yapay zeka laboratuvarı DeepSeek’e çevrilmişken, Alibaba kendi yenilikleriyle öne çıkmayı başardı. Şirketin Qwen ekibi, Qwen2.5-VL adını verdiği yeni yapay zeka modeli ailesini duyurdu. Metin ve görüntü analizi gibi karmaşık işlemler yapabilen modeller, dosya işleme, video anlama, görüntülerdeki nesneleri sayma ve bilgisayar ya da mobil cihazları kontrol etme gibi yetenekleriyle dikkat çekiyor. OpenAI’nin Operator modeliyle benzer özellikler sunan Qwen2.5-VL, zengin işlevselliğiyle öne çıkıyor.
Qwen ekibinin benchmark testlerine göre, model video analizi, matematik, belge işleme ve soru-cevap performansı gibi alanlarda OpenAI’nin GPT-4o, Anthropic’in Claude 3.5 Sonnet ve Google’ın Gemini 2.0 Flash modellerini geride bıraktı. Alibaba’nın Qwen Chat uygulaması üzerinden test edilebilen ve Hugging Face platformundan indirilebilen Qwen2.5-VL, grafik ve tabloları analiz edebiliyor, taranmış belgelerden veri çıkarabiliyor ve uzun videoları anlamlandırabiliyor. Ayrıca, film ve TV dizilerindeki karakterler ile farklı ürünleri tanıyabildiği belirtiliyor. Eğitim sürecinde telif hakkıyla korunan materyallerden yararlanılmış olabileceği de dikkat çeken bir detay.
Çin merkezli bir yapay zeka ürünü olan Qwen2.5-VL, politik olarak hassas konulara yanıt vermeme eğilimi taşıyor. Örneğin, Qwen2.5-VL-72B’ye “Xi Jinping’in hataları” sorulduğunda, model bir hata mesajı verdi. Çin’in internet düzenleyicileri, yapay zeka sistemlerinin “temel sosyalist değerleri” yansıtmasını zorunlu kılıyor. Bu nedenle Tayvan’ın özerkliği gibi hassas konular çoğu Çin yapay zeka modeli tarafından yanıtsız bırakılıyor.
En dikkat çekici özelliklerinden biri, bilgisayar ve mobil yazılımlarla etkileşim kurabilmesi. Hugging Face teknik lideri Philipp Schmid tarafından paylaşılan bir videoda, modelin Android’de Booking.com uygulamasını başlatarak Chongqing’den Pekin’e uçak bileti rezervasyonu yaptığı gösterildi. Ancak modelin bu alandaki başarısı henüz sınırlı. Bir başka videoda, Linux masaüstü ortamında sekmeler arasında geçiş yapmanın ötesine geçemediği görüldü. Bu durum, Qwen2.5-VL’nin OSWorld benchmark testinde düşük puan almasıyla da doğrulandı.
Model ailesi, farklı kullanıcı ihtiyaçlarını karşılamak için üç versiyon halinde sunuluyor. Daha küçük boyutlara sahip Qwen2.5-VL-3B ve Qwen2.5-VL-7B modelleri esnek bir lisansla sunulurken, amiral gemisi olarak tanımlanan Qwen2.5-VL-72B özel bir lisansa tabi. Bu lisans, aylık 100 milyondan fazla aktif kullanıcıya sahip şirket ve geliştiricilerin ticari kullanım için Alibaba’dan izin almasını gerektiriyor.
Qwen2.5-VL serisi, gelişmiş veri işleme kapasitesi ve zengin yetenekleriyle Alibaba’nın yapay zeka alanındaki iddiasını güçlendiriyor. Hukuki belgeleri anlama ve işleme gibi spesifik alanlarda gösterdiği performans, eğitim sürecinde kullanılan geniş veri setinin bir sonucu. Bu modeller, hem Çin teknoloji sahnesinde rekabeti artıracak hem de uluslararası alanda yankı uyandıracak bir potansiyele sahip.