Yapay Zeka

12/9/2024

Mistral ilk multimodal modeli Pixtral 12B'yi piyasaya sürdü.

Fransız yapay zeka girişimi Mistral, metinlerin yanı sıra görüntüleri de işleyebilen ilk modelini piyasaya sürdü.

Pixtral 12B olarak adlandırılan 12 milyar parametreli model yaklaşık 24 GB boyutunda. Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.

Mistral'in metin modellerinden biri olan Nemo 12B üzerine inşa edilen yeni model, URL'ler veya ikili-metin kodlama şeması olan base64 kullanılarak kodlanmış görüntüler verilen rastgele boyuttaki rastgele sayıda görüntü hakkındaki soruları yanıtlayabilir. Anthropic'in Claude ailesi ve OpenAI'nin GPT-4o'su gibi diğer çok modlu modellere benzer şekilde, Pixtral 12B de - en azından teoride - resimlere başlık ekleme ve bir fotoğraftaki nesnelerin sayısını sayma gibi görevleri yerine getirebilmelidir.

GitHub ve yapay zeka ve makine öğrenimi geliştirme platformu Hugging Face'deki bir torrent bağlantısı aracılığıyla sunulan Pixtral 12B, Apache 2.0 lisansı altında herhangi bir kısıtlama olmaksızın indirilebilir, ince ayar yapılabilir ve kullanılabilir.

Mistral'in Pixtral 12B'yi geliştirmek için hangi görüntü verilerini kullanmış olabileceği belli değil.

Mistral'in diğer modelleri de dahil olmak üzere çoğu üretici yapay zeka modeli, genellikle telif hakkıyla korunan web'deki çok sayıda kamuya açık veri üzerinde eğitiliyor. Bazı model satıcıları, “adil kullanım” haklarının kendilerine herhangi bir kamusal veriyi kazıma hakkı verdiğini savunuyor, ancak birçok telif hakkı sahibi buna katılmıyor ve uygulamayı durdurmak için OpenAI ve Midjourney gibi daha büyük satıcılara karşı davalar açtı.

Pixtral 12B, Mistral'in General Catalyst tarafından yönetilen ve şirkete 6 milyar dolar değer biçen 645 milyon dolarlık bir finansman turunu kapatmasının ardından geldi. Bir yıldan biraz daha eski olan Mistral - Microsoft'un azınlık hissesine sahip olduğu - yapay zeka topluluğundaki birçok kişi tarafından Avrupa'nın OpenAI'ye cevabı olarak görülüyor. Genç şirketin şimdiye kadarki stratejisi, ücretsiz “açık” modeller yayınlamak, bu modellerin yönetilen sürümleri için ücret almak ve kurumsal müşterilere danışmanlık hizmetleri sunmaktı.