Yapay Zeka Uygulamaları
20/8/2025
Adobe Photoshop, Photutorial’a göre dünya çapındaki yaratıcı profesyonellerin %90’ından fazlası tarafından kullanılan en tanınmış yazılımlardan biri. Dolayısıyla Çinli e-ticaret devi Alibaba’nın araştırma ekibi Qwen tarafından geliştirilen ve yalnızca metin komutlarıyla Photoshop benzeri çok sayıda düzenleme işlemini gerçekleştirebilen açık kaynak yapay zeka modeli Qwen-Image Edit’in yayınlanması dikkat çekici bir gelişme.
20 milyar parametreli Qwen-Image temel modeline dayanan Qwen-Image-Edit, metin tabanlı işleme gücünü düzenleme görevlerine taşıyarak ince görünüm değişikliklerinden kapsamlı anlamsal dönüşümlere kadar geniş bir yelpazede işlem yapabiliyor. Bir başlangıç görseli yükleyip yapılması istenen değişiklikleri yazmak yeterli; sistem saniyeler içinde düzenlenmiş yeni bir görsel üretiyor.
Model, Qwen Chat, Hugging Face, ModelScope, GitHub ve Alibaba Cloud API üzerinden erişime açık. Geliştiriciler ve kurumlar API sayesinde sistemi kendi uygulamalarına veya iş akışlarına entegre edebiliyor. Açık kaynak olarak Apache 2.0 lisansı ile sunulması, kurumlara lisans ücreti ödemeden kendi altyapılarında kurulum yapma imkânı tanıyor.
Qwen Chat üzerinden yapılan denemelerde ücretsiz kullanıcılar 12 saatlik periyotta 8 giriş–çıkış işlemine sahipken, ücretli kullanıcılar daha fazla işleme erişebiliyor. Sistem hem İngilizce hem de Çince girdileri destekliyor, böylece küresel içerik üreticileri için erişilebilir hale geliyor.
Qwen ekibinden araştırmacı Junyang Lin, X platformunda şunları yazdı: “Bir saç telini bile kaldırabiliyor, son derece hassas görsel düzenleme.”
Qwen-Image Edit, Qwen-Image’in çift kodlama (dual-encoding) mimarisini temel alıyor. Görseller aynı anda hem Qwen2.5-VL üzerinden anlamsal kontrol için hem de Varyasyonel Otokodlayıcı (VAE) üzerinden detayların korunması için işleniyor. Böylece sistem hem sahnenin anlamını değiştirebiliyor hem de özgün görselin stilini koruyarak ince düzenlemeler yapabiliyor.
Qwen-Image Edit’in öne çıkan özelliklerinden biri de iki dilli metin düzenleme. Hem Çince hem İngilizce metinler, yazı tipi, boyut ve stil korunarak eklenebiliyor, silinebiliyor veya değiştirilebiliyor. Bu özellik bilhassa posterler, tabelalar, tişörtler ya da kaligrafi eserlerinde büyük önem taşıyor.
Bir örnekte, yanlış oluşturulmuş Çince kaligrafi adım adım düzeltilerek doğru karakterler elde edildi. Kullanıcı yanlış bölgeyi işaretleyip düzeltme talep ettiğinde sistem bunu aşamalı şekilde geliştirdi.
Qwen ekibi, modelin potansiyel uygulama alanlarını şöyle sıralıyor:
Qwen ekibine göre model, kamuya açık benchmark testlerinde görüntü düzenleme konusunda en güncel ve en yüksek performanslı sonuçları verdi. Daha önceki Qwen-Image modeli de AI Arena gibi bağımsız değerlendirmelerde öne çıkmıştı.
Her ne kadar Qwen-Image Edit için spesifik metrikler paylaşılmasa da temel modelin güçlü performansı üzerine inşa edildiği vurgulandı.
Qwen-Image Edit, Alibaba Cloud Model Studio üzerinden API olarak kullanılabiliyor. Fiyatlandırma, görsel başına 0,045 ABD doları. Aktivasyondan sonraki 180 gün boyunca geçerli 100 ücretsiz görsel kotası sunuluyor.
Hizmet ilk etapta Singapur bölgesinde erişime açık. Kullanıcılar saniyede 5 isteğe kadar işlem yapabiliyor ve aynı anda en fazla 2 görev yürütebiliyor. Görseller URL veya Base64 formatında gönderilebiliyor; 512 ile 4096 piksel çözünürlük arasında destek sağlanıyor. Sonuç görselleri 24 saat süreyle indirilebilir linkler üzerinden paylaşılıyor.
Qwen, Image-Edit’i görsel içerik üretiminde bariyerleri azaltmaya yönelik bir adım olarak konumlandırıyor. Model, hassas ve stil tutarlı düzenlemeleri daha erişilebilir hale getirerek hem profesyonel tasarım stüdyolarına hem de bireysel kullanıcılara hitap ediyor.
Ekip, söz konusu yaklaşımın yapay zekâ gelişiminde daha geniş bir trendin parçası olduğunu vurguluyor: yalnızca içerik üretmekle kalmayıp düzenleme, düzeltme ve iyileştirme yeteneklerini bir araya getiren çok yönlü araçların ortaya çıkışı.