Runway'den İddialı Çıkış: Yeni Gen-4.5 Modeli "Benzeri Görülmemiş" Doğruluk Sunuyor

Runway, en son geliştirdiği metinden videoya dönüştürme modelinin, bir öncekinden çok daha isabetli görseller oluşturduğunu iddia ediyor. Pazartesi günü yayınlanan bir blog yazısında şirket, Gen-4.5 modelinin "sinematik ve son derece gerçekçi çıktılar" üretebildiğini, böylece neyin gerçek neyin yapay zeka olduğunu ayırt etmeyi potansiyel olarak daha da zorlaştırdığını belirtiyor.

Runway'in duyurusunda, "Gen-4.5 benzeri görülmemiş fiziksel doğruluk ve görsel hassasiyet sağlıyor." ifadeleri yer alıyor. Açıklamada, yeni yapay zeka modelinin komutlara daha iyi uyum sağladığı ve video kalitesinden ödün vermeden ayrıntılı sahneler üretilmesine olanak tanıdığı ekleniyor. Runway, yapay zeka tarafından oluşturulan nesnelerin "gerçekçi ağırlık, momentum ve kuvvetle hareket ettiğini", sıvıların ise "uygun dinamiklerle aktığını" söylüyor.

Runway'e göre Gen-4.5 modeli tüm kullanıcılara kademeli olarak sunuluyor ve selefiyle aynı hız ve verimliliği sağlayacak. Yine de bazı sınırlamalar bulunuyor; model nesne kalıcılığı ve nedensel akıl yürütme ile ilgili sorunlar yaşayabilir; yani birisi kolu kullanmadan kapının açılması gibi, nedenlerden önce sonuçların gerçekleşmesi durumları görülebilir.

Runway ile birlikte OpenAI da yapay zeka tarafından oluşturulan videolarının daha gerçekçi görünmesi için çabalarını artırıyor. OpenAI, Eylül ayında Sora 2 metinden videoya modelinin piyasaya sürülmesiyle fizikteki yükseltmeleri vurgulamıştı. Sora lideri Bill Peebles, "Bir su kütlesi üzerindeki bir sörf tahtasının tepesinde isabetli bir şekilde ters takla atabilirsiniz ve tüm sıvı dinamiği ile kaldırma kuvveti doğru bir şekilde modellenir." demişti.

Runway, Gen-4.5 modelinin farklı görsel stilleri ele almada da daha iyi olduğunu, böylece daha tutarlı fotogerçekçi, stilize ve sinematik görseller üretilmesine olanak tanıdığını belirtiyor. Girişim, Gen-4.5 ile oluşturulan fotogerçekçi görsellerin "gerçekçi ayrıntı ve doğrulukla, gerçek dünya görüntülerinden ayırt edilemez" olabileceğini iddia ediyor.

Kaynak: https://www.theverge.com/news/834905/runway-ai-text-video-generator-launch