Yapay Zeka Uygulamaları
4/6/2025
Google, işaret dilini konuşulan metne çeviren en gelişmiş yapay zeka modeli olan SignGemma’yı Google I/O 2025 etkinliğinde tanıttı. Araç hâlihazırda test aşamasında bulunuyor ve geliştiriciler ile seçilmiş kullanıcılar tarafından denenebiliyor. Daha geniş çaplı kullanıma yıl sonuna kadar sunulması bekleniyor.
İşaret dili, konuşma engeli bulunan birçok kişi için hayati öneme sahip. Çevreleriyle iletişim kurmak için işaret dili kullanıyorlar; ancak genel toplumda işaret dilini anlayan kişi sayısı oldukça sınırlı. Şimdi yapay zeka da bu alanda devreye giriyor. Google, işaret dilini metne çevirebilen SignGemma adlı bir yapay zeka modeli üzerinde çalışıyor. Şirket, bu modelin şimdiye kadar geliştirdiği en yetenekli yapay zeka olduğunu ve işaret dilini konuşulan metne çevirmek üzere tasarlandığını belirtiyor. Yeni yapay zeka modeli şu anda test aşamasında ve yıl sonuna kadar kamuya açık biçimde yayınlanması planlanıyor.
Google, SignGemma’yı ilk kez Google I/O etkinliğindeki açılış konuşmasında tanıttı. Gemma Ürün Müdürü Gus Martins, modeli şirketin “şimdiye kadar geliştirdiği en yetenekli işaret dili anlama modeli” olarak tanımladı. Martins, önceki işaret dili çeviri girişimlerinden farklı olarak, SignGemma’nın açık model yaklaşımı ile öne çıktığını ve kullanıcılara doğru, gerçek zamanlı çeviri sağlamaya odaklandığını vurguladı. Araç çeşitli işaret dillerini tanıyacak şekilde eğitilmiş olsa da, Google modeli şu anda en iyi Amerikan İşaret Dili (ASL) ve İngilizce kombinasyonlarında çalıştığını belirtiyor.
Gus Martins etkinlikte, “SignGemma’yı, işaret dili anlayışı alanında çığır açan açık modelimizi duyurmaktan büyük heyecan duyuyoruz. Bu yılın ilerleyen dönemlerinde yayımlamayı planlıyoruz. Bu, şimdiye kadar geliştirdiğimiz en yetenekli işaret dili anlama modeli ve geliştiricilerin, işitme engelli ve işitme kayıplı toplulukların bu temelin üzerine inşa etmeleri için sabırsızlanıyoruz.” ifadelerini kullandı.
Google, bu araçla birlikte dünya genelinde milyonlarca işitme engelli ve işitme kayıplı birey için iletişim engellerini kaldırmayı amaçladığını vurguladı.
Aynı zamanda, aracın hem etkili hem de kullanıcı kitlesine saygılı olmasını sağlamak için Google geliştirme sürecinde iş birliğine dayalı bir yaklaşım benimsiyor. Şirket, geliştiriciler, araştırmacılar ve küresel işitme engelli topluluklarına erken test sürecine katılmaları ve geri bildirim sağlamaları için açık bir davet gönderdi.
DeepMind’in X platformundaki resmi gönderisinde, “SignGemma’yı, işaret dili anlayışında çığır açan açık modelimizi duyurmaktan büyük heyecan duyuyoruz. Hazırlık süreci ve sonrasında SignGemma’nın olabildiğince faydalı ve etkili olması için benzersiz deneyimleriniz, içgörüleriniz ve ihtiyaçlarınız çok önemli.” sözleri yer aldı.
SignGemma’nın tanıtımı, Google’ın yapay zeka portföyünü genişletmeye odaklandığı bir dönemde geldi. Google I/O 2025 etkinliğinde erişilebilirlik, birçok yeni YZ destekli özellikle birlikte gündemin merkezindeydi. Bunlar arasında, Android’in TalkBack özelliğine entegre edilen Gemini AI ile kullanıcıların ekranlarındaki görseller hakkında açıklama alabilmesi ve takip eden soruları sorabilmesi gibi imkanlar da yer aldı.
Google ayrıca Chrome tarayıcısına yönelik güncellemeler sundu. Bunlar arasında taranmış PDF dosyalarına yönelik otomatik optik karakter tanıma (OCR) özelliği de bulunuyor. Bu özellik sayesinde ekran okuyucu kullanan kişiler daha önce erişilemeyen belgelerdeki metinlere erişebilecek, arama yapabilecek ve etkileşime geçebilecek.
Öğrenciler için ise, Chromebook cihazlara gelen yeni Face Control özelliği sayesinde yüz ifadeleri ve baş hareketleriyle cihazı kontrol etmek mümkün olacak.