Yapay Zeka
5/12/2025

Fransız yapay zeka girişimi Mistral, salı günü yeni Mistral 3 açık ağırlıklı model ailesini piyasaya sürdü. Gerçekleştirilen lansman, şirketin yapay zekayı halka açık hale getirme konusunda liderlik edebileceğini ve ticari müşterilere büyük teknoloji rakiplerinden daha iyi hizmet verebileceğini kanıtlamayı amaçlıyor.
On farklı modelden oluşan sürüm, çok modlu ve çok dilli yeteneklere sahip büyük bir öncü model ile dokuz adet daha küçük, çevrimdışı çalışabilen ve tamamen özelleştirilebilir yapıyı içeriyor.
Açık ağırlıklı dil modelleri ve Avrupa odaklı yapay zeka sohbet robotu Le Chat'i geliştiren Mistral, Silikon Vadisi'nin bazı kapalı kaynaklı öncü modellerini yakalamaya çalışıyor gibi görünüyor. Açık ağırlıklı modeller, model ağırlıklarını herkesin indirip çalıştırabileceği şekilde halka açık olarak yayınlarken, OpenAI'ın ChatGPT'si gibi kapalı kaynaklı modeller ağırlıklarını gizli tutuyor ve yalnızca API'ler veya kontrollü arayüzler aracılığıyla erişim sağlıyor.
Eski DeepMind ve Meta araştırmacıları tarafından kurulan iki yıllık girişim, bugüne kadar 13,7 milyar dolar değerleme üzerinden yaklaşık 2,7 milyar dolar fon topladı. Toplanan rakamlar, OpenAI (500 milyar dolar değerleme ile 57 milyar dolar fon) ve Anthropic (350 milyar dolar değerleme ile 45 milyar dolar fon) gibi rakiplerin elde ettiği sayıların yanında oldukça küçük kalıyor ancak Mistral, özellikle kurumsal kullanım durumları için daha büyüğün her zaman daha iyi olmadığını kanıtlamaya çalışıyor. Mistral kurucu ortağı ve baş bilimcisi Guillaume Lample, TechCrunch'a şunları söyledi:
"Müşterilerimiz bazen ince ayar yapmak zorunda olmadıkları çok büyük [kapalı] bir modelle başlamaktan mutlu oluyorlar... ancak dağıtıma geçtiklerinde bunun pahalı ve yavaş olduğunu fark ediyorlar. Sonra kullanım durumunu [daha verimli bir şekilde] ele almak için küçük modellere ince ayar yapmak üzere bize geliyorlar."
Lample sözlerine şöyle devam etti: "Uygulamada, kurumsal kullanım durumlarının büyük çoğunluğu, özellikle ince ayar yaparsanız küçük modellerle çözülebilecek şeylerdir."
Lample, Mistral'in daha küçük modellerini kapalı kaynaklı rakiplerinin oldukça gerisine yerleştiren ilk kıyaslama karşılaştırmalarının yanıltıcı olabileceğini belirtti. Büyük kapalı kaynaklı modeller kutudan çıktığı haliyle daha iyi performans gösterebilir fakat gerçek kazanımlar özelleştirme yapıldığında ortaya çıkar.
Mistral'in Mistral Large 3 olarak adlandırılan büyük öncü modeli, OpenAI'ın GPT-4o ve Google'ın Gemini 2 modelleri gibi daha büyük kapalı kaynaklı yapay zeka modellerinin sahip olduğu bazı önemli yetenekleri yakalarken, aynı zamanda birçok açık ağırlıklı rakibiyle de başa baş mücadele ediyor. Large 3, çok modlu ve çok dilli yetenekleri bir arada sunan ilk açık öncü modellerden biri olarak Meta'nın Llama 3 ve Alibaba'nın Qwen3-Omni modelleriyle aynı seviyede yer alıyor. Diğer birçok şirket şu anda etkileyici büyük dil modellerini ayrı daha küçük çok modlu modellerle eşleştiriyor, Mistral de benzer bir yaklaşımı daha önce Pixtral ve Mistral Small 3.1 gibi modellerle uygulamıştı.
Large 3 ayrıca, 41 milyar aktif parametre ve 675 milyar toplam parametreye sahip "ayrıntılı Uzmanlar Karışımı" (Mixture of Experts) mimarisiyle, 256.000 bağlam penceresinde verimli akıl yürütme sağlıyor. Hem hız hem de yetenek sunan tasarım, uzun belgelerin işlenmesine ve karmaşık kurumsal görevler için ajan (agentic) bir asistan olarak işlev görmesine olanak tanıyor. Mistral, Large 3'ü belge analizi, kodlama, içerik oluşturma, yapay zeka asistanları ve iş akışı otomasyonu için uygun bir araç olarak konumlandırıyor.
Mistral, Ministral 3 olarak adlandırılan yeni küçük model ailesiyle, daha küçük modellerin sadece yeterli değil, aynı zamanda üstün olduğu yönünde cesur bir iddiada bulunuyor.
Model serisi, üç boyutta (14 milyar, 8 milyar ve 3 milyar parametre) ve üç varyantta (Base: önceden eğitilmiş temel model, Instruct: konuşma ve asistan tarzı iş akışları için sohbet optimize edilmiş ve Reasoning: karmaşık mantık ve analitik görevler için optimize edilmiş) dokuz farklı, yüksek performanslı yoğun modeli içeriyor.
.png)
Mistral, yelpazenin geliştiricilere ve işletmelere, ham performans, maliyet verimliliği veya özelleşmiş yetenekler arayışında olsalar da modelleri tam performans ihtiyaçlarına göre eşleştirme esnekliği sağladığını belirtiyor. Şirket, Ministral 3'ün diğer açık ağırlıklı liderlerle aynı seviyede veya daha iyi puan aldığını, daha verimli olduğunu ve eşdeğer görevler için daha az token ürettiğini iddia ediyor. Tüm varyantlar görme yeteneğini destekliyor, 128.000-256.000 bağlam pencerelerini işliyor ve diller arasında sorunsuz çalışıyor.

Sunumun önemli bir parçası da pratiklik. Lample, Ministral 3'ün tek bir GPU üzerinde çalışabildiğini ve böylece yerinde sunuculardan dizüstü bilgisayarlara, robotlara ve sınırlı bağlantıya sahip olabilecek diğer uç cihazlara kadar uygun fiyatlı donanımlarda konuşlandırılabileceğini vurguluyor. Sağlanan kolaylık, yalnızca verileri kurum içinde tutan işletmeler için değil, aynı zamanda çevrimdışı geri bildirim arayan öğrenciler veya uzak ortamlarda çalışan robotik ekipleri için de önem taşıyor. Lample, daha yüksek verimliliğin doğrudan daha geniş erişilebilirliğe dönüştüğünü savunuyor.
Lample vizyonlarını "Yapay zekanın herkes, özellikle de internet erişimi olmayan insanlar için erişilebilir olduğundan emin olmak misyonumuzun bir parçası. Yapay zekanın sadece birkaç büyük laboratuvar tarafından kontrol edilmesini istemiyoruz." şeklinde açıkladı.
Diğer bazı şirketler de benzer verimlilik ödünleşimlerini takip ediyor, Cohere'in en son kurumsal modeli Command A da sadece iki GPU üzerinde çalışıyor ve yapay zeka ajan platformu North sadece tek bir GPU üzerinde çalışabiliyor.
Bahsedilen türden bir erişilebilirlik, Mistral'in büyüyen fiziksel yapay zeka odağını yönlendiriyor. Şirket, içinde bulunduğumuz yılın başlarında daha küçük modellerini robotlara, dronlara ve araçlara entegre etmek için çalışmalara başladı. Mistral, robotlar, siber güvenlik sistemleri ve yangın güvenliği için özelleşmiş modeller üzerine Singapur'un Home Team Bilim ve Teknoloji Ajansı (HTX) ile, dronlar için görme-dil-eylem modelleri üzerine Alman savunma teknolojisi girişimi Helsing ile ve araç içi yapay zeka asistanı üzerine otomobil üreticisi Stellantis ile işbirliği yapıyor.
Mistral için güvenilirlik ve bağımsızlık performans kadar kritik öneme sahip.
Lample sözlerini şöyle tamamladı:
"Rakiplerimizin iki haftada bir yarım saatliğine çökecek bir API'sini kullanmak; eğer büyük bir şirketseniz, bunu göze alamazsınız."