Yapay Zeka

19/7/2024

OpenAI, daha küçük ve çok daha ucuz bir çok modlu yapay zeka modeli olan GPT-4o mini'yi tanıttı.

İki aydan biraz daha uzun bir süre önce OpenAI, yardım için diğer modellere bağlanmadan çok modlu girdileri ve çıktıları (metin, görüntü, ses ve nihayetinde video) işlemek üzere şirket tarafından yerel olarak eğitilen ilk model olan en yeni ve en güçlü yapay zeka modeli GPT-4o'yu piyasaya sürdü.

Piyasaya sürüldüğünde üçüncü taraf kıyaslamalarında dünyanın en güçlü, halka açık yapay zeka modeliydi, ancak birkaç hafta sonra rakibi Anthropic'in Claude 3.5 Sonnet'i tarafından kısa bir süre sonra geride bırakıldı ve o zamandan beri ikisi başa baş gidiyor.

Ancak OpenAI bununla da kalmıyor: bugün, bu modelin daha küçük bir versiyonu olan GPT-4o mini'yi duyuruyor ve “piyasadaki en uygun maliyetli küçük model” olduğunu, geliştiricilere bir kullanıcının girdiği 1 milyon token başına sadece 0,15 USD'ye mal olduğunu ve OpenAI'nin uygulama programlama arayüzlerini (API'ler) kullanarak üzerine inşa edilen üçüncü taraf uygulamaları ve hizmetleri için modelden geri aldıkları her milyon için 0,60 USD'ye mal olduğunu söylüyor.

Ayrıca, 1 milyon girdi jetonu için 5,00 $ ve 1 milyon çıktı jetonu başına 15 $ maliyeti olan GPT-4o'dan çok daha ucuzdur.

Hatırlayacağınız gibi belirteçler, belirli bir büyük dil modeli (LLM) veya küçük dil modeli (SML) içindeki anlamsal birimleri, kelimeleri, sayıları ve diğer verileri temsil eden sayısal kodlardır - GPT-4o mini gibi görünen ikincisi (OpenAI, modelin sahip olduğu parametre sayısını veya yapay nöronlar arasındaki bağlantıları yayınlamadı, bu da ne kadar büyük veya küçük olduğunu söylemeyi zorlaştırıyor, ancak “mini” adı açıkça bir gösterge veriyor).

OpenAI'nin API Ürün Başkanı Olivier Godement, dün VentureBeat'e verdiği telekonferans röportajında GPT-4o mini'nin özellikle “müşteri destek aracısından” “finansal aracıya” kadar “herhangi bir aracı inşa eden” işletmeler, yeni başlayanlar ve geliştiriciler için yararlı olduğunu, çünkü bunların tipik olarak “API'ye çok sayıda geri arama” gerçekleştirdiğini, bunun da temel kaynak modeli tarafından girilen ve çıkarılan yüksek miktarda belirteçle sonuçlandığını ve bunun da maliyetleri hızla artırabileceğini söyledi.

Godement, “Zeka başına maliyet o kadar iyi ki, bunun her türlü müşteri desteği, yazılım mühendisliği, yaratıcı yazarlık ve her türlü görev için kullanılmasını bekliyorum” dedi. “Ne zaman yeni bir model benimsesek, yeni durumlar ortaya çıkıyor ve bence bu GPT-4o mini için daha da geçerli olacak.”

GPT-4o mini'yi piyasaya sürme hamlesi, Meta'nın önümüzdeki hafta beklenen devasa Llama 3 400 milyar parametreli modelini piyasaya sürmesinden önce geliyor ve bu haberin önüne geçmek ve geliştiricilerin zihninde OpenAI'nin kurumsal düzeyde yapay zeka alanında lider olmaya devam ettiğini pekiştirmek için tasarlanmış gibi görünüyor.

GPT-4o mini'nin maliyetini perspektife koymak gerekirse, GPT-4o'nun piyasaya sürülmesinden bu yana OpenAI'nin teklifleri arasında en uygun fiyatlı model olan GPT-3.5 Turbo'dan %60 daha az.

Aynı zamanda, modelin GPT-3.5 Turbo kadar hızlı çalışması ve saniyede yaklaşık 67 jeton iletmesi hedefleniyor.

OpenAI, GPT-4o mini'yi GPT-3.5 Turbo'nun doğrudan halefi olarak tanıtıyor, ancak yalnızca metni işleyebilen GPT-3.5 Turbo'nun aksine metin ve görüntü girdilerini de işleyebildiği için çok daha yetenekli bir model.

OpenAI, gelecekte bir noktada GPT-4o mini'nin görüntü ve ses ve video dahil diğer çok modlu çıktıları da üretebileceğini ve bunları girdi olarak kabul edebileceğini söylüyor. Ancak şimdilik sadece metin ve hareketsiz görüntü/belge girdileri mevcut olacak.

Şu anda GPT-4o mini, bir dizi üçüncü taraf kıyaslamasında GPT-3.5 Turbo'dan, Google'ın Gemini 1.5 Flash ve Anthropic'in Claude 3 Haiku gibi diğer benzer sınıftaki modellerden ve hatta bazı görevlerde GPT-4'ün kendisinden daha iyi performans gösteriyor.

Özellikle OpenAI, GPT-4o mini'nin matematik, bilim, tarih ve daha birçok konuda çoktan seçmeli sorular içeren Massive Multitask Language Understanding (MMLU) testinde Gemini Flash için %77,9 ve Claude Haiku için %73,8'e karşılık %82,0 puan aldığını gösteren kıyaslamalar yayınladı.

Buna ek olarak Godement VentureBeat'e yaptığı açıklamada GPT-4o mini'nin bu sonbaharda Apple Inc. şirketinin yeni yapay zeka hizmeti Apple Intelligence aracılığıyla mobil cihazları ve Mac masaüstü bilgisayarları için kullanıma sunulacağını ve OpenAI ile Apple arasında geçen ay WWDC etkinliğinde duyurulan ortaklığın bir parçası olarak yeni iOS 18 yazılımının piyasaya sürülmesiyle aynı zamana denk geleceğini söyledi.

Bununla birlikte, model hala OpenAI bulut sunucularında çalışacak - cihaz üzerinde değil, bu da ilk etapta küçük bir model çalıştırmanın avantajlarından birini, doğası gereği daha hızlı, daha güvenli ve web bağlantısı gerektirmeyen yerel bir çıkarımı ortadan kaldırıyor gibi görünüyor.

Yine de Godement, OpenAI bulut sunucularına bağlanırken bile GPT-4o mini modelinin şirketten temin edilebilen diğer modellerden daha hızlı olduğunu belirtti. Dahası, VentureBeat'e verdiği demeçte, OpenAI'nin birlikte çalıştığı çoğu üçüncü taraf geliştiricinin, şirketin modellerini yerel olarak çalıştırmakla henüz ilgilenmediğini, çünkü bunun çok daha yoğun kurulum ve bilgi işlem donanımı gerektireceğini söyledi.

Bununla birlikte, GPT-4o mini'nin piyasaya sürülmesi OpenAI geliştirici müşterilerinin artık modeli yerel olarak daha uygun maliyetli ve daha az donanımla çalıştırabilme olasılığını artırıyor, bu nedenle Godement böyle bir çözümün bir gün sağlanmasının söz konusu olmadığını söyledi.

Bugünden itibaren GPT-4o mini, Plus ve Teams planları da dahil olmak üzere ChatGPT'nin ücretli aboneleri için seçenekler arasında GPT-3.5 Turbo'nun yerini alacak - ChatGPT Enterprise için destek önümüzdeki hafta gelecek. Model, web ve Mac masaüstü uygulamalarının sol üst köşesindeki açılır menüde görünecek.

Bununla birlikte, ChatGPT kullanıcıları GPT-4o mini'yi seçtikleri için ücretli aboneliklerinde bir fiyat indirimi almayacaklar - yalnızca API üzerine inşa eden geliştiriciler tasarruflardan yararlanacak.

Yine de ChatGPT kullanıcıları GPT-3.5 Turbo'dan daha yeni, daha hızlı ve daha güçlü bir modele otomatik olarak erişebilecekler, bu da kesinlikle bir avantaj.

OpenAI henüz API'lerinde GPT-3.5 Turbo desteğini kullanımdan kaldırmıyor veya aşamalı olarak kaldırmıyor, çünkü şirket geliştiricileri yükseltmeye zorlamak veya şu anda bu eski modelin üzerine inşa edilmiş uygulamaları bozmak istemiyor.

Bunun yerine şirket, önemli bir maliyet düşüşü ve zeka ve diğer yeteneklerde artış sağladığından, geliştiricilerin doğal olarak yeni modeli kullanmaya hızlı bir şekilde toplu olarak geçeceğine inanıyor.

Godement'e göre, kurumsal gider yönetimi ve hesap yazılımı başlangıcı Ramp ve bulut e-posta yapay zeka başlangıcı Superhuman dahil olmak üzere bazı geliştiriciler GPT-4o mini'yi zaten alfa testine tabi tutuyor ve her ikisinin de mükemmel sonuçlar bildirdiği söyleniyor.