En Son Haberler
26/12/2024
Google'ın yeni yapay zeka aracı görsel konseptlerinizi oluşturmanızı ve yeniden düzenlemenizi kolaylaştırıyor. Aklınızdan geçenleri tanımlamanızı istemek yerine Whisk, biri konu, biri sahne ve biri de stil için olmak üzere üç görsel girmenize izin veriyor. Gerisini Whisk hallediyor ve farklı fikirleri denemek için daha sezgisel bir yol sunuyor.
En iyi yapay zeka görüntü oluşturucularının çoğu ayrıntılı bir istem yazmanızı gerektirirken, Whisk bunu perde arkasında halleder. Web tabanlı Whisk arayüzüne ilham kaynağı olarak resimler bıraktığınızda, Google'ın Gemini modeli bunları otomatik olarak analiz ediyor ve her biri için ayrıntılı bir başlık yazıyor. Bunlar daha sonra eşleşen bir görüntü oluşturmak için Imagen 3 modeline beslenir.
Örneğin, konu olarak bir araba görüntüsü ve sahne için kırsal bir manzara fotoğrafı ekleyebilirsiniz. Whisk'in ne yarattığını görmek için stil olarak bir suluboya ekleyebilirsiniz. Düğmeye bastığınızda girdilerinize göre bir çift görüntü elde edeceksiniz.
Buradan, görüntüleri yeniden karıştırmak kolaydır. Arayüz, sonuçları değiştirmek için metin tabanlı ek ayrıntılar belirlemenize olanak tanır. İlhama ihtiyacınız varsa farklı kaynak görselleri kolayca ekleyebilir veya zar atabilirsiniz. Yeni sonuçlar akışta çiftler halinde görünür, bu da onu fikir üretmenin sezgisel bir yolu haline getirir. Ayrıca metin istemini ortaya çıkararak ve daha fazla ayrıntı ekleyerek görüntüleri iyileştirmeyi de seçebilirsiniz.
Whisk, metin tabanlı ipuçlarına olan ihtiyacı ortadan kaldırmak üzere tasarlanmış olsa da, sonuçlar her zaman kaynak materyalle eşleşmeyeceğinden Google yazılı ipuçlarını iyileştirme seçeneğini de sunuyor.
Deneysel araçla ilgili bir blog yazısında Google, Whisk'in “öznenizin birebir kopyasını değil, özünü yakaladığını” açıklıyor. Yalnızca Gemini'nin gönderdiğiniz görüntüleri analiz ettiği kadar etkilidir. Bu genellikle çok etkileyici olsa da, aynı zamanda zihninizin içine giremiyor: Whisk'in bir görüntüden bir ayrıntıyı çıkarmasını beklerken, başka bir ayrıntıya odaklanmasını bekleyebilirsiniz.
Yazı daha da açıklıyor: “Whisk görüntünüzden yalnızca birkaç temel özelliği çıkardığı için, beklentilerinizden farklı görüntüler oluşturabilir. Örneğin, oluşturulan özne farklı bir boy, kilo, saç stili veya cilt tonuna sahip olabilir. Bu özelliklerin projeniz için çok önemli olabileceğini ve Whisk'in hedefi ıskalayabileceğini anlıyoruz, bu nedenle temel istemleri istediğiniz zaman görüntülemenize ve düzenlemenize izin veriyoruz.”