Yapay Zeka

5/3/2024

Google'ın Gemini 1.5 Pro'su yeni, daha verimli bir yapay zeka modelidir

Perşembe günü Google, şirketin önceki modele göre "önemli ölçüde geliştirilmiş performans" sağladığını tanımladığı Gemini 1.5 Pro'yu tanıttı. Şirketin, şirket içinde geleceği açısından giderek daha kritik olarak görülen yapay zeka yörüngesi, geçen hafta Gemini 1.0 Ultra'nın tanıtılmasının yanı sıra, yeni modelin daha güçlü ve çok yönlü yetenekleriyle uyum sağlamak için Bard chatbot'un (Gemini'ye) yeniden markalanmasının ardından geldi.

Bir duyuru blog yazısında, Google CEO'su Sundar Pichai ve Google DeepMind CEO'su Demis Hassabis, modellerinin hızla ilerleyen yeteneklerini öne çıkarırken hedef kitlesine etik yapay zeka güvenliği konusunda güvence verme arasında bir denge kurmaya çalışıyor. Pichai, "Ekiplerimiz güvenliği temel alarak en yeni modellerimizde sınırları zorlamaya devam ediyor" diye özetledi.

Şirketin, AI şüphecileri (eski bir Google CEO'su dahil) ve hükümet düzenleyicileri için güvenliği vurgulaması gerekiyor. Ancak aynı zamanda yapay zeka geliştiricileri, potansiyel müşteriler ve yatırımcılar için modellerinin artan performansının, şirketin OpenAI'nin ChatGPT ile elde ettiği çığır açan başarıya tepki vermekte çok yavaş olmasından endişe duyması gerektiğini de vurgulaması gerekiyor.

Pichai ve Hassabis, Gemini 1.5 Pro'nun Gemini 1.0 Ultra ile benzer sonuçlar sağladığını söylüyor. Ancak Gemini 1.5, daha az hesaplama gereksinimiyle bu düzeyde daha verimli bir performans sergiliyor. Çok modlu yetenekler arasında metin, resim, video, ses veya kod işleme yer alır. Yapay zeka modelleri geliştikçe, tek bir bilgi kutusunda daha çok yönlü yetenekler sunmaya devam edecekler (son dönemdeki bir diğer örnek OpenAI'nin DALL-E 3 görüntü oluşturmayı ChatGPT'ye entegre etmesiydi).

Alphabet Inc. ve Google CEO'su Sundar Pichai, 15 Şubat 2024'te Paris'te bir Google Yapay Zeka (AI) merkezinin açılışına katıldı. (Fotoğraf: ALAIN JOCARD / AFP) (Fotoğraf: ALAIN JOCARD/AFP, Getty Images aracılığıyla)Alphabet Inc. ve Google CEO'su Sundar Pichai, 15 Şubat 2024'te Paris'te bir Google Yapay Zeka (AI) merkezinin açılışına katıldı. (Fotoğraf: ALAIN JOCARD / AFP) (Fotoğraf: ALAIN JOCARD/AFP, Getty Images aracılığıyla)
Google CEO'su Sundar Pichai (Getty Images aracılığıyla ALAIN JOCARD) Gemini 1.5 Pro ayrıca bir milyona kadar jetonu veya yapay zeka modellerinin tek bir istekte işleyebileceği veri birimlerini işleyebilir. Google, Gemini 1.5 Pro'nun 700.000'den fazla kelimeyi, bir saatlik videoyu, 11 saatlik ses ve 30.000'den fazla kod satırına sahip kod tabanlarını işleyebileceğini söylüyor. Şirket, 10 milyona kadar tokenı destekleyen bir sürümün bile "başarılı bir şekilde test edildiğini" söylüyor.

Şirket, Gemini 1.5 Pro'nun öğrenilecek daha fazla yeni veri olduğunda daha büyük token sayımlarıyla sorgularda yüksek doğruluğu koruduğunu söylüyor. Modelin Needle In a Haystack değerlendirmesinde etkilendiği belirtiliyor. Bu testte geliştiriciler, yapay zeka modelinin onu seçip seçemeyeceğini görmek için uzun bir metin bloğunun içine küçük bir bilgi parçası ekliyor. Google, Gemini 1.5 Pro'nun gömülü metni yüzde 99 oranında veri bloklarında bir milyon jetona kadar uzunlukta bulabileceğini söyledi.

Google, Gemini 1.5 Pro'nun 402 sayfalık Apollo 11 ay görevi transkriptlerinden çeşitli ayrıntılar hakkında akıl yürütebileceğini söylüyor. Ayrıca, Buster Keaton'ın başrolde olduğu, yüklenen 44 dakikalık sessiz bir filmdeki olay örgüsünü ve olayları analiz edebiliyor. Hassabis, "1.5 Pro'nun uzun bağlam penceresi, büyük ölçekli modeller arasında türünün ilk örneği olduğundan, yeni yeteneklerini test etmek için sürekli olarak yeni değerlendirmeler ve kıyaslamalar geliştiriyoruz" diye yazdı.

Google, 128.000 jeton kapasiteli Gemini 1.5 Pro'yu piyasaya sürüyor; bu, OpenAI'nin (kamuya duyurulan) GPT-4 modellerinin maksimuma ulaştığı sayıyla aynı. Hassabis, Google'ın sonunda bir milyona kadar jeton sorgusunu destekleyen yeni fiyatlandırma katmanları sunacağını söyledi.

NEW YORK, NEW YORK - 02 MAYIS: Demis Hassabis, 02 Mayıs 2023'te New York'ta Spring Studios'ta düzenlenen 2023 WSJ Her Şeyin Geleceği Festivaline katıldı.  (Fotoğraf: Joy Malone/Getty Images)NEW YORK, NEW YORK - 02 MAYIS: Demis Hassabis, 02 Mayıs 2023'te New York'ta Spring Studios'ta düzenlenen 2023 WSJ Her Şeyin Geleceği Festivaline katıldı.  (Fotoğraf: Joy Malone/Getty Images)
Google DeepMind CEO'su Demis Hassabis (Getty Images aracılığıyla Joy Malone)
Gemini 1.5 Pro ayrıca, ek ince ayar yapmadan ("bağlam içi öğrenme") uzun istemlerdeki bilgilerden yeni beceriler öğrenme konusunda da ustadır. Model, Tek Kitaptan Makine Çevirisi adı verilen bir kıyaslamada, dünya çapında 200'den az konuşmacının bulunduğu ve daha önce üzerinde eğitim almadığı bir dil olan Kalamang için bir dilbilgisi kılavuzu öğrendi. Şirket, Gemini 1.5 Pro'nun, İngilizce'yi Kalamang'a çevirirken aynı içeriği öğrenen bir insanla benzer düzeyde performans göstermeyi öğrendiğini söylüyor.

Geliştiricilerin dikkatini çekecek duyurunun bir bölümünde Google, Gemini 1.5 Pro'nun daha uzun kod bloklarında problem çözme görevlerini gerçekleştirebileceğini söylüyor. Hassabis, "100.000'den fazla kod satırı içeren bir komut verildiğinde, örnekler arasında daha iyi mantık yürütebilir, yararlı değişiklikler önerebilir ve kodun farklı bölümlerinin nasıl çalıştığı hakkında açıklamalar verebilir" diye yazdı.

Etik ve güvenlik cephesinde Google, Gemini 1.0 modellerinde izlediği "sorumlu dağıtım konusundaki yaklaşımın aynısını" benimsediğini söylüyor. Bu, bir grup etik geliştiricinin esasen şeytanın avukatı olarak hizmet ettiği ve "bir dizi potansiyel zararı" test ettiği kırmızı ekip tekniklerinin geliştirilmesini ve uygulanmasını içerir. Ayrıca şirket, içerik güvenliği ve temsili zararlar gibi alanları da yoğun bir şekilde incelediğini söylüyor. Şirket, yapay zeka araçları için yeni etik ve güvenlik testleri geliştirmeye devam ettiğini söylüyor.

Google, geliştiriciler ve kurumsal müşteriler için Gemini 1.5'i erken erişimde kullanıma sunuyor. Şirket, ilerleyen zamanlarda bunu daha geniş çapta kullanılabilir hale getirmeyi planlıyor. Gemini 1.0, aylık 20 ABD doları tutarındaki Pro sürümüyle birlikte şu anda tüketicilere sunuluyor.

Kaynak: https://www.engadget.com/googles-gemini-15-pro-is-a-new-more-efficient-ai-model-181909354.html