Gemini AI Artık Fotoğrafları Videoya Dönüştürebiliyor

Google, üretken yapay zeka yeteneklerini geliştirmeye devam ederek Gemini AI için dikkat çekici bir yenilik duyurdu. Yeni özellik sayesinde kullanıcılar, yalnızca bir fotoğraf ve kısa bir açıklama kullanarak sekiz saniyelik yapay zeka destekli videolar oluşturabilecek. Söz konusu dönüşüm, Google’ın gelişmiş video modeli Veo 3 tarafından sağlanıyor. Model, yalnızca görüntüyü işlemekle kalmıyor; aynı zamanda yapay zeka tarafından oluşturulan arka plan sesleri, çevresel efektler ve konuşmaları da videoya entegre ediyor.

Google’ın açıklamasına göre yeni özellik, şu anda belirli bölgelerde Google AI Ultra ve Pro aboneleri için erişime açık durumda. Web kullanıcıları için bugün itibarıyla kullanıma sunulurken, mobil cihazlara dağıtımı hafta boyunca devam edecek.

Kullanıcıların bu özellikle video oluşturabilmeleri için Gemini arayüzünde, komut çubuğunda yer alan “araçlar (tools)” bölümünden “video” seçeneğini seçmeleri yeterli. Ardından bir fotoğraf yükleyip, görselin nasıl hareket etmesini istediklerine dair kısa bir metin açıklaması giriliyor. Ayrıca kullanıcılar, sahnede duyulmasını istedikleri diyalog, ses efekti ya da ortam sesleri için ayrı açıklamalar ekleyebiliyor. Google, “görsellerle mükemmel şekilde senkronize edilen” ses içeriklerinin yapay zeka tarafından üretileceğini belirtiyor.

Oluşturulan videolar, 720p çözünürlükte, 16:9 oranında yatay formatta, MP4 dosyası olarak teslim ediliyor. Google tarafından yapılan açıklamada, “Günlük nesneleri canlandırarak, çizim ve resimlerinize hareket kazandırarak ya da doğa sahnelerine dinamizm ekleyerek yaratıcılığınızı ortaya koyabilirsiniz.” deniliyor. Ayrıca her videoda, yapay zeka tarafından üretildiğini açıkça gösteren görünür bir filigran yer alırken, SynthID adlı görünmez dijital filigran da videoya dahil ediliyor.

Benzer bir animasyon özelliği, daha önce Google’ın Mart ayında piyasaya sürdüğü Flow adlı üretken video oluşturma uygulamasında mevcuttu. Ancak şimdi Gemini kullanıcıları aynı işlevi doğrudan kendi arayüzlerinde gerçekleştirebilecek. Bu gelişmeyle birlikte, Google yalnızca Gemini’ye yeni bir yetenek kazandırmakla kalmıyor, aynı zamanda Flow platformunu da 75 yeni ülkede kullanıma açıyor. Böylelikle Google’ın üretken video alanındaki küresel erişimini daha da artırıyor.

Kaynak: https://www.theverge.com/news/703885/google-gemini-ai-photo-video-feature-availability