Yapay Zeka
16/4/2025
On yıllardır, yunusların tıklamalar, ıslıklar ve patlama sesi benzeri vokal sinyallerle gerçekleştirdiği iletişim, bilimsel araştırmaların önemli bir sınır alanını oluşturdu. Peki yalnızca onları dinlemekle kalmayıp, iletişim biçimlerini yeterince anlayarak gerçekçi tepkiler üretmek mümkün olsaydı ne olurdu?
Google, Georgia Tech araştırmacıları ve Wild Dolphin Project (WDP) iş birliğiyle geliştirilen DolphinGemma adlı yeni temel yapay zeka modeliyle, yunus seslerinin yapısını öğrenme ve yunus benzeri yeni ses dizileri üretme konusunda önemli bir ilerleme kaydettiğini açıkladı. Bu yaklaşım, türler arası iletişim arayışında yapay zekanın sınırlarını zorlayan bir örnek olarak dikkat çekiyor.
Bir türü anlamak, kapsamlı bağlam bilgisi gerektirir. Wild Dolphin Project tam da bunu sağlıyor. 1985 yılından bu yana WDP, Bahamalar’daki Atlantik benekli yunuslardan (Stenella frontalis) oluşan belirli bir vahşi topluluğu nesiller boyunca inceleyerek dünyanın en uzun soluklu su altı yunus araştırma projesini yürütüyor. “Onların Dünyasında, Onların Şartlarında” şeklindeki müdahalesiz yaklaşımları, her biri belirli bireylerle, yaşam öyküleriyle ve gözlenen davranışlarla eşleştirilmiş onlarca yıllık video ve ses kaydını içeren zengin ve benzersiz bir veri seti oluşturdu.
WDP’nin temel hedeflerinden biri, yunusların doğal iletişimini ve sosyal etkileşimlerini gözlemlemek ve analiz etmek. Su altında çalışmak, sesleri belirli davranışlarla doğrudan ilişkilendirme imkanı sunduğu için, yüzeyden yapılan gözlemlere kıyasla çok daha anlamlı bilgiler sağlıyor. Araştırmacılar, uzun yıllar boyunca ses türlerini davranış bağlamlarıyla eşleştirdi. Örneğin:
İlgili bireyleri tanımak, doğru yorumlama için büyük önem taşıyor. Bu gözlemsel çalışmaların nihai amacı, doğal ses dizilerinin yapısını ve olası anlamlarını çözmek. Dil benzeri kurallar ve kalıpların olup olmadığını belirlemek, WDP’nin uzun vadeli iletişim analizlerinin temelini oluşturuyor ve yapay zeka modelleri için gerekli olan bağlamsal altyapıyı sağlıyor.
Yunusların doğal ve karmaşık iletişim biçimlerini analiz etmek oldukça zorlu bir görev. Ancak WDP’nin etiketlenmiş geniş veri tabanı, son teknoloji yapay zeka modelleri için eşsiz bir fırsat sunuyor.
Google tarafından geliştirilen DolphinGemma, Google’ın ses teknolojilerini kullanıyor: Dolphin seslerini verimli biçimde temsil eden SoundStream kodlayıcısı ile bu sesleri karmaşık diziler için optimize edilmiş bir model mimarisi işliyor. Yaklaşık 400 milyon parametreli olan bu model, WDP’nin sahada kullandığı Pixel telefonlarda çalışabilecek şekilde optimize edildi.
DolphinGemma, Google’ın Gemini modellerine güç veren araştırmalara dayalı, hafif ve gelişmiş açık model koleksiyonu Gemma’dan elde edilen içgörüler üzerine inşa edildi. WDP’nin vahşi Atlantik benekli yunuslara ait akustik veritabanı kullanılarak eğitilen model, ses girdisi alan ve yine ses çıktısı veren bir yapıdadır. İnsan dili modellerinde olduğu gibi, doğal ses dizilerini işleyerek kalıpları ve yapıları tanımlar, ardından dizide sıradaki sesi tahmin eder.
WDP, DolphinGemma’yı bu saha sezonunda kullanmaya başlıyor. Model, tekrar eden ses kalıplarını, kümeleri ve güvenilir dizileri belirleyerek araştırmacıların doğal iletişimdeki gizli yapıları ve olası anlamları ortaya çıkarmasına yardımcı olabiliyor. Önceden oldukça yoğun insan emeği gerektiren bu süreç, artık yapay zeka ile destekleniyor. Araştırmacılar, yunusların oynamayı sevdikleri nesneleri temsil eden sentetik sesler oluşturarak bu kalıpları zenginleştirmeyi ve interaktif bir iletişim kurabilmeyi hedefliyor.
WDP, doğal iletişimi analiz etmenin yanı sıra, okyanusta teknoloji kullanarak potansiyel iki yönlü etkileşim imkanlarını da araştırıyor. Georgia Institute of Technology iş birliğiyle geliştirilen bu çalışma, CHAT (Cetacean Hearing Augmentation Telemetry) adlı sistemle yürütülüyor. CHAT, yunusların doğal dili yerine daha basit, paylaşılan bir sözcük dağarcığı kurmayı hedefleyen bir su altı bilgisayarı.
Konsept, yunusların ilgisini çeken nesnelerle ilişkilendirilen yapay, sistem tarafından oluşturulmuş ıslıkların kullanılmasıyla başlıyor. Bu nesneler arasında saragassum, deniz çimi ya da araştırmacıların kullandığı şallar yer alıyor. Araştırmacılar, bu sistemi önce insanlar arasında deneyimleyerek, meraklı doğaları sayesinde yunusların ıslıkları taklit etmeyi öğrenmesini ve söz konusu nesneleri talep etmelerini bekliyor. Araştırmalar ilerledikçe, yunusların doğal sesleri de sisteme dahil edilebilecek.
İki yönlü etkileşimin gerçekleşebilmesi için CHAT sisteminin şu işlevleri yerine getirmesi gerekiyor:
Yüksek kaliteli ses analizleri, gerçek zamanlı olarak bir Google Pixel 6 üzerinden gerçekleştirildi. Yaz 2025’te yapılması planlanan yeni saha araştırmalarında, bu sistemin gelişmiş sürümünde Google Pixel 9 kullanılacak. Yeni sürüm, hoparlör ve mikrofon özellikleriyle birlikte hem derin öğrenme modellerini hem de şablon eşleştirme algoritmalarını aynı anda çalıştırabilecek.
Pixel telefonlar sayesinde özel donanım ihtiyacı azaltılıyor, sistem daha kolay bakıma alınıyor, güç tüketimi düşüyor ve cihazın boyutu ile maliyeti küçülüyor. Okyanus ortamındaki saha araştırmaları için bu avantajlar hayati önem taşıyor. DolphinGemma’nın tahmin yetenekleri sayesinde CHAT, taklitleri daha ses dizisinin erken evresinde tanıyabiliyor ve araştırmacılar yunuslara daha hızlı yanıt vererek etkileşimi daha akıcı ve pekiştirici hale getirebiliyor.
Bilimsel keşiflerde iş birliğinin öneminin farkında olan Google, DolphinGemma’yı yaz aylarında açık model olarak paylaşmayı planlıyor. Model, her ne kadar Atlantik benekli yunuslara ait seslerle eğitilmiş olsa da, tırtak veya döner yunus gibi diğer deniz memelisi türlerini inceleyen araştırmacılar için de faydalı olabilir. Farklı türlerin vokalizasyonları için yeniden eğitilmesi gerekebilir; modelin açık yapısı bu uyarlamayı kolaylaştırıyor.
Google, DolphinGemma gibi araçları sunarak araştırmacıların kendi akustik veri setlerini analiz etmesini, kalıpların keşfini hızlandırmasını ve deniz memelilerini daha derinlemesine anlamalarını sağlamayı amaçlıyor.
Yunus iletişimini anlamak uzun bir yolculuk. Ancak WDP’nin özverili saha çalışmaları, Georgia Tech’in mühendislik uzmanlığı ve Google’ın ileri teknolojisi sayesinde, artık yalnızca dinlemiyor; seslerin içindeki örüntüleri anlamaya başlıyoruz. Bu sayede insan-yunus iletişimi arasındaki mesafe bir parça daha kısalabilir.