Yapay Zeka
17/4/2025
İçerik üretimi ve sosyal platform alanında öncü şirketlerden Kuaishou Technology, Kling AI 2.0 Modeli için Pekin’de “From Vision to Screen” lansman etkinliğini düzenledi. Etkinlikte, Kling AI 2.0 Video Üretim Modeli ve Kling AI 2.0 Görsel Üretim Modeli resmen tanıtıldı. Bu yeni sürüm, Kling’in temel modellerinde kapsamlı bir yükseltme sürecinin başlangıcını temsil ediyor.
Dünyanın kullanıcı erişimine açık ilk DiT tabanlı video üretim modeli olan Kling AI, geçtiğimiz yıl Haziran ayında ilk lansmanından bu yana 22 milyon küresel kullanıcıya ulaştı. 27 Mart’ta yapay zeka benchmark kurumu Artificial Analysis, video üretim modelleri için küresel sıralamalarını yayımladı. Kling 1.6 Pro, Görselden Videoya kategorisinde Arena ELO puanı 1.000 ile zirveye yerleşti. Google Veo 2 ve Pika Art ise sırasıyla ikinci ve üçüncü oldu.
Kling AI, lansmanından bu yana 20’den fazla iterasyondan geçti; görüntü netliğini iyileştiren, yaratıcı kontrolü artıran ve temel kaliteyi yükselten pek çok özellik eklendi. Kuaishou Kıdemli Başkan Yardımcısı ve Topluluk Bilimi Departmanı Başkanı Gai Kun, Kling AI’nin misyonunun “herkesin YZ ile güçlü hikâyeler anlatabilmesini sağlamak” olduğunu vurguladı.
Kling AI 2.0, hareket kalitesi, anlamsal tepki verme yeteneği ve görsel estetik alanlarında küresel sektöre öncülük ediyor. Aynı zamanda Kolors 2.0 modeli, sinematik kalite ve sanatsal stil ifadeleriyle büyük ilerlemeler kaydetti. Gai Kun, GSB (İyi-Benzetilen-Kötü) metodolojisiyle yapılan çoklu metrik testlerde Kling modellerinin sektörün zirvesinde yer aldığını açıkladı. Kling AI 2.0, Google Veo 2 karşısında %182, Runway Gen-4’e karşı ise %178 galibiyet oranı elde etti.
Gai Kun ayrıca, içerik üretiminde YZ’nin potansiyelinin yüksek olduğunu fakat mevcut çözümlerin kullanıcı beklentilerini karşılamaktan uzak olduğunu belirtti: “Karmaşık fikirleri doğru ifade etmekte zorluklar var; bu nedenle insan-YZ etkileşimi için yeni bir dil tanımlamak zorundayız.”
Yeni versiyonla birlikte, MVL (Çok Modlu Görsel Dil) konsepti tanıtıldı. Kullanıcılar, görsel referanslar ve video klipler gibi çok modlu girdilerle; kimlik, stil, senaryo, hareket, mimik, kamera açısı gibi unsurları YZ’ye doğrudan aktararak fikirlerini daha hassas şekilde iletebiliyor.
“Yalnızca metin görsel bilgiyi aktarmak için yeterli değil. İnsanların düşüncelerini doğru ifade edebilmesi için yeni bir yaklaşım gerekiyor.” diyen Gai Kun, MVL’ın temel iki bileşeninin TXT (saf metin) ve MMW (çok modlu belge) olduğunu belirtti.
Yeni konsept çerçevesinde çok modlu düzenleme özelliği de kullanıma açıldı. Gai Kun: “Bugünden itibaren, kullanıcılar doğrudan görsel ya da diğer formatlarla girdiler sağlayarak fikirlerine uygun videolar üretebilir.” dedi. Ayrıca MMW teknolojisi, görsellerin ötesine geçerek ses ve hareket rotaları gibi bilgileri de kapsayacak.
Kuaishou Başkan Yardımcısı ve Kling AI Başkanı Zhang Di, etkinlikte Kling AI 2.0 Master Edition sürümünü tanıttı. Bu versiyon, anlamsal tepki, hareket kalitesi ve görsel estetikte kapsamlı bir performans artışı sunuyor. Kullanıcı talimatlarına daha hassas uyum, sinematik ifade kabiliyeti ve 60’tan fazla stilize efekt desteği, yaratıcılığı ileri bir boyuta taşıyor.
Yeni sürümdeki çok modlu video düzenleme özelliği, kullanıcıların içerik öğelerini ekleme, silme veya değiştirme yeteneğini sağlayarak üretim sürecinde daha esnek kontrol sunuyor.
Kolors 2.0 tarafında da görsel düzenleme fonksiyonları genişletildi. Kullanıcılar, görseli kısmen yeniden çizebilir, genişletebilir, ekleme ve onarım yapabilir. Ayrıca stil dönüşümü özelliğiyle yüklenen görselin sanatsal tarzı değiştirilirken anlam bütünlüğü korunuyor.
Zhang Di, Kling AI videolarının %85’inin görselden videoya üretildiğini ve görsel kalitenin nihai sonuç üzerinde belirleyici olduğunu belirtti. Kolors, Midjourney V7, FLUX 1.1 Pro ve Reve gibi modeller karşısında anlam çözümleme, sinematik kalite ve çoklu koşul altında stil üretimi gibi alanlarda üstünlük sağlıyor. “Kling AI 2.0 Master Edition, yalnızca teknik bir yükseltme değil; aynı zamanda kullanıcı deneyiminde tam spektrumlu bir sıçrama.” ifadelerini kullandı.
Kling AI, bireysel kullanıcılar için abonelik hizmetlerinin yanı sıra kurumsal müşteriler için API çözümleri de sunuyor. Bugüne dek Xiaomi, AWS, Alibaba Cloud, Freepik, BlueFocus gibi birçok küresel markayla iş birliği gerçekleştirildi.
Dünya genelinde 15.000’in üzerinde geliştirici ve kurumsal müşteri, Kling API’yi kullanarak yaklaşık 12 milyon görsel ve 40 milyon video üretti.
Yönetmen Chen Xiangyu, Kling AI’nin yaratıcı içerik sürecine tam entegre olduğunu belirtti: “Senaryo yazımından sahne detaylarına kadar tüm üretim aşamasında Kling AI ile çok daha yaratıcı ve esnek ilerliyoruz.” AIGC’nin yeni nesil içerik yapısının temelini oluşturabileceğini vurguladı.
Etkinlikte ayrıca Kling AI NextGen Girişim Sermayesi Programı başlatıldı. Bu program, AIGC yaratıcılarını yatırım desteği, küresel tanıtım ve IP koruma olanaklarıyla desteklemeyi hedefliyor. Kuaishou, küresel yaratıcıları, ilk kullanıcılarla birlikte üretilmiş AIGC kısa filmi oluşturmaya ve bunu Şanghay, Hong Kong, Tokyo, Paris ve Toronto gibi şehirlerdeki reklam panolarında göstermeye davet etti.
Gai Kun, “Hedefimiz, herkesin YZ ile iyi bir hikâye anlatabilmesini sağlamak ve bunu daha erken mümkün kılmak.” diyerek şirketin inovasyon odaklı ilerlemeye kararlılıkla devam edeceğini ifade etti.