Yapay Zeka

24/10/2025

Reddit, İçeriğini Yapay Zeka Eğitimi için İzinsiz Kullandığı Gerekçesiyle Perplexity’ye Dava Açtı

Reddit, Perplexity ve üç “veri kazıma hizmet sağlayıcısını” dava ederek, dava dilekçesine göre, “kötü niyetli aktörlerden oluşan bir grubun Reddit üzerinde yer alan değerli telifli içeriğe ulaşmak için hiçbir sınır tanımayan sanayi ölçeğinde ve hukuka aykırı veri koruma ihlallerini durdurmayı” hedeflediğini açıkladı. Şirket, adı geçen veri toplama şirketlerini SerpApi, Oxylabs ve AWMProxy olarak sıralıyor.

Şirket, veri kazıma şirketlerini “banka kasasına giremeyeceklerini bildikleri için nakit taşıyan zırhlı aracı soyan potansiyel banka soyguncularına” benzetti. Reddit, Perplexitynin bu veri kazıma şirketlerinden “en az birinin” müşterisi olduğunu öne sürüyor ve Perplexitynin “'cevap motorunu' beslemek için umutsuzca ihtiyaç duyduğu Reddit verilerini elde etmek adına, bazı rakiplerinin yaptığı gibi Reddit ile doğrudan bir anlaşma yapmak dışında her şeyi yapmaya istekli olduğunu” iddia ediyor.

Dava dosyasına göre Reddit, Mayıs 2024'te Perplexityye bir ihtar mektubu gönderdi ve şirketten “Reddit verilerini kazımayı durdurmasını” talep etti. O dönemde Perplexity, Reddite Reddit içeriğini YZ modellerini eğitmek için kullanmadığını ve Reddit’in robots.txt yönergelerine uyacağını söyledi. Ancak Reddit, bu yanıttan sonra Perplexity üzerinde görülen Reddit atıflarının hacminin aslında arttığını belirtiyor. Şirket ayrıca yalnızca Google tarafından taranabilecek bir gönderi oluşturdu ve şirketin anlatımına göre “saatler içinde” Perplexity, “o gönderinin içeriğini üretti.”

Reddit, dava dilekçesinde “Perplexity'nin o Reddit içeriğine ulaşmasının ve ardından o içeriği 'cevap motorunda' kullanmasının tek yolu, kendisinin ve/veya Eş Davalılarının o Reddit içeriği için Google arama sonuç sayfalarını kazıması ve Perplexity'nin daha sonra bu veriyi hızlı şekilde cevap motoruna entegre etmesi olurdu.” ifadesini kullandı.

Reddit tarafından paylaşılan çerçevede, platform üzerinde kullanıcılar tarafından yazılan ve diğer kullanıcılar tarafından oylanarak öne çıkarılan her konuda yer alan gönderiler, YZ modellerini eğitmek açısından son derece değerli görülüyor. Şirket, bunun farkında olduğunu açıkça belirtiyor. 2023 yılında kitlesel protestolara yol açan API değişiklikleri, Reddit’in platform verilerinin YZ şirketleri tarafından ücretsiz kullanılmasına son vermek ve bu veriler için maddi karşılık alabilmek amacıyla yapılmıştı. Reddit, OpenAI ve Google dahil olmak üzere YZ şirketleriyle anlaşmalar yaptı ve daha iyi şartlar istediği ifade edildi. Ayrıca Reddit, daha önce Anthropice karşı da yasal işlem başlattı ve Anthropic botlarının, Anthropicin erişim sağlamayacağını söylemesinden sonra bile Reddit platformuna eriştiğini iddia etti.

Reddit’in baş hukuk sorumlusu Ben Lee, yaptığı açıklamada “YZ şirketleri kaliteli insan içeriği için bir silahlanma yarışına kilitlenmiş durumda ve bu baskı sanayi ölçeğinde bir 'veri aklama' ekonomisini körüklüyor. Veri toplayıcılar teknolojik korumaları aşarak veriyi çalıyor, ardından eğitim materyaline aç müşterilere satıyor. Reddit, insan konuşmasının bugüne kadar yaratılmış en büyük ve en dinamik kümelerinden biri olduğu için ilk hedeflerden biri.”

Lee, açıklamasını şu şekilde sürdürdü: “Sanıklar Oxylabs UAB, AWM Proxy ve SerpAI, Litvanyalı bir veri toplayıcı, eski bir Rus botneti ve yasa dışı yöntemlerini açıkça tanıtan bir şirket, bu yasa dışı davranışın ders kitabı örnekleri. Reddit'i doğrudan kazıyamadıkları noktada kimliklerini maskelemek, yerlerini gizlemek ve web kazıyıcılarını kamufle etmek suretiyle Google Arama üzerinden Reddit içeriğini çalıyorlar. Perplexity ise en az bir veri toplayıcının istekli müşterisi konumunda; Reddit ile yasal bir anlaşmaya girmek yerine çalıntı veriyi satın almayı tercih ediyor.”

Çarşamba günü ilerleyen saatlerde Perplexity, Reddit üzerinde daha uzun bir açıklama yayımladı. Açıklamada şu ifadeler yer aldı: “İçerik lisanslaması hakkında biri bize soru sorduğunda, Perplexity'nin bir uygulama katmanı şirketi olarak içeriği YZ modellerini eğitmek için kullanmadığını anlatıyoruz. Hiç kullanmadı. Dolayısıyla bunu yapmak için lisans anlaşması imzalamamız imkansız.”Perplexity, aynı metinde “Bir yıl önce bunu açıkladıktan sonra Reddit, Reddit verisine hukuka uygun şekilde erişmemize rağmen ödeme yapmamız konusunda ısrar etti. Zorlayıcı taktiklere boyun eğmek bizim iş yapma şeklimiz değil.” değerlendirmesini paylaştı.

Kaynak: https://www.theverge.com/news/804660/reddit-suing-perplexity-data-scrapers-ai-lawsuit