Yapay Zeka

12/5/2025

Alibaba, Yapay Zekaya Arama Motoru Olmadan Bilgi Aramayı Öğretti

Alibaba Group araştırmacıları, yapay zeka sistemlerini bilgi arama konusunda eğitmenin maliyetini ve karmaşıklığını büyük ölçüde azaltabilecek yeni bir yöntem geliştirdi. Bu teknik, pahalı ticari arama motoru API’larına olan ihtiyacı tamamen ortadan kaldırıyor.

ZeroSearch adı verilen yöntem, büyük dil modellerinin (LLM'ler) gerçek arama motorlarıyla etkileşime girmeden, simülasyon temelli bir yaklaşımla gelişmiş arama yetenekleri kazanmasını sağlıyor. Söz konusu yenilik, şirketlerin API harcamalarını ciddi oranda düşürürken, yapay zekanın bilgiye nasıl ulaştığını daha iyi kontrol etme imkanı sunuyor.

Araştırmacılar, arXiv'de yayımladıkları makalelerinde şöyle yazdı: “Pekiştirmeli öğrenme (RL) eğitimi, yüz binlerce arama isteğini içerebilecek sık sık yapılan denemeleri gerektirir, bu da ciddi API maliyetleri oluşturur ve ölçeklenebilirliği ciddi şekilde sınırlar. Bu zorlukları aşmak için, gerçek arama motorlarıyla etkileşime girmeden LLM'lerin arama yeteneklerini teşvik eden bir pekiştirmeli öğrenme çerçevesi olan ZeroSearch’ü tanıtıyoruz.”

ZeroSearch: Arama Motoru Olmadan Yapay Zekayı Eğitmek

ZeroSearch’ün çözdüğü sorun oldukça kritik. Bilgi arayabilen yapay zeka asistanları geliştiren şirketler, eğitim sırasında iki büyük zorlukla karşılaşıyor: arama motorlarının sunduğu belgelerin kalitesinin öngörülemezliği ve yüz binlerce API çağrısının yüksek maliyetleri.

Alibaba’nın yaklaşımı, hafif denetimli bir ince ayar süreciyle başlıyor. Bu süreç, LLM’yi, bir sorguya yanıt olarak hem alakalı hem de alakasız belgeler üretebilen bir erişim modülüne dönüştürüyor. Pekiştirmeli öğrenme aşamasında ise, sistemin ürettiği belgelerin kalitesini kademeli olarak düşüren “müfredat tabanlı deneme stratejisi” kullanılıyor.

Araştırmacılar şu açıklamayı yapıyor: “Temel farkındalığımız şu ki, LLM'ler büyük ölçekli ön eğitim sırasında kapsamlı dünya bilgisi edinmiştir ve bir arama sorgusu verildiğinde alakalı belgeler üretebilirler. Gerçek bir arama motoru ile simüle edilmiş bir LLM arasındaki temel fark, döndürülen içeriğin metinsel stilinde yatmaktadır.”

Google’ı Geride Bırakan Performans ve Maliyet Tasarrufu

Yedi farklı soru-cevap veri seti üzerinde yapılan kapsamlı deneylerde, ZeroSearch yalnızca gerçek arama motorlarıyla eğitilen modellerin performansını yakalamakla kalmadı, çoğu zaman geçti. Özellikle, 7 milyar parametreli bir erişim modülü Google Arama ile karşılaştırılabilir sonuçlar elde ederken, 14 milyar parametreli modül bu performansı aştı.

Maliyet farkı ise dikkat çekici. Araştırmacıların analizine göre, Google Search üzerinden SerpAPI kullanılarak yaklaşık 64.000 arama sorgusu ile eğitim yapmak 586,70 dolara mal oluyor. Buna karşılık, 4 adet A100 GPU üzerinde çalışan 14B parametreli simülasyon LLM kullanmak yalnızca 70,80 dolar gerektiriyor. Bu, %88’lik bir maliyet düşüşü anlamına geliyor.

Makale şu ifadeyle devam ediyor: “Bu, iyi eğitilmiş bir LLM’nin, pekiştirmeli öğrenme kurulumlarında gerçek arama motorlarının yerine geçebilmesinin uygulanabilirliğini göstermektedir.”

Yapay Zeka Gelişiminde Yeni Dönem

Bu atılım, yapay zeka sistemlerinin nasıl eğitileceği konusunda büyük bir değişimi işaret ediyor. ZeroSearch, yapay zekanın dış araçlara bağımlı olmadan gelişebileceğini kanıtlıyor.

Şimdiye dek, ileri düzey yapay zeka sistemlerini eğitmek için büyük teknoloji şirketlerine ait hizmetlere yapılan pahalı API çağrıları kaçınılmazdı. ZeroSearch, bu denklemi değiştirerek, yapay zekanın gerçek arama motorlarını kullanmak yerine aramayı kendi içinde simüle ederek öğrenmesini sağlıyor.

Sınırlı bütçeye sahip küçük yapay zeka şirketleri ve girişimler için bu yaklaşım büyük bir fırsat eşitliği sunuyor. Yüksek API maliyetleri, şimdiye dek gelişmiş yapay zeka asistanları geliştirmek isteyen firmalar için önemli bir engeldi. ZeroSearch ile neredeyse %90 maliyet tasarrufu sağlanarak bu engel aşılabiliyor.

Maliyet avantajının ötesinde, bu teknik geliştiricilere eğitim süreci üzerinde daha fazla kontrol sağlıyor. Gerçek arama motorları kullanıldığında, döndürülen belgelerin kalitesi öngörülemez oluyor. Simüle edilmiş arama sayesinde geliştiriciler, yapay zekanın eğitim sırasında hangi bilgilere erişeceğini hassas şekilde belirleyebiliyor.

ZeroSearch tekniği, Qwen-2.5 ve LLaMA-3.2 gibi farklı model aileleriyle ve hem temel hem de talimata uyarlanmış varyantlarla çalışıyor. Araştırmacılar, geliştirdikleri kodları, veri setlerini ve önceden eğitilmiş modelleri GitHub ve Hugging Face üzerinde paylaşarak diğer araştırmacıların ve şirketlerin de bu yöntemi uygulamasına olanak tanıdı.

Büyük dil modelleri gelişmeye devam ederken, ZeroSearch gibi teknikler, yapay zeka sistemlerinin dış hizmetlere bağımlı olmadan kendi kendini simüle ederek gelişebileceği bir geleceğin kapılarını aralıyor. Bu da yapay zeka geliştirme ekonomisini değiştirebilir ve büyük teknoloji platformlarına olan bağımlılığı azaltabilir.

Makalenin sonunda ironik bir tespit yapılmış: “Yapay zekaya arama motorları olmadan aramayı öğretirken, Alibaba, yapay zeka geliştirme için geleneksel arama motorlarını gereksiz kılabilecek bir teknoloji üretmiş olabilir. Bu sistemler daha bağımsız hale geldikçe, teknoloji dünyası birkaç yıl içinde çok farklı görünebilir.”

Kaynak:https://venturebeat.com/ai/alibabas-zerosearch-lets-ai-learn-to-google-itself-slashing-training-costs-by-88-percent/