OpenAI’nin Eski CTO’su Mira Murati’nin Yapay Zeka Laboratuvarı İlk Ürününü Tanıttı

OpenAI’nin önde gelen araştırmacılarından bazıları tarafından kurulan ve büyük finansman desteği alan Thinking Machines Lab, ilk ürününü duyurdu. Şirketin geliştirdiği Tinker, özel yapay zeka modellerinin ince ayarını otomatikleştiren bir araç olarak tanıtıldı.

Thinking Machines’in kurucu ortağı ve CEO’su Mira Murati, WIRED’a verdiği röportajda şunları söyledi: “Tinker’in araştırmacıların ve geliştiricilerin modellerle deney yapmalarına yardımcı olacağına ve öncü yetenekleri herkes için çok daha erişilebilir hale getireceğine inanıyoruz.”

Günümüzde büyük şirketler ve akademik laboratuvarlar, açık kaynaklı YZ modellerini belirli görevler için optimize ederek yeni varyantlar geliştiriyor ama süreç, GPU kümelerinin satın alınması ve yönetilmesi, büyük ölçekli eğitimlerin stabil çalıştırılmasını sağlamak için farklı yazılımlar kullanılması gibi zahmetli aşamalar içeriyor. Tinker, karmaşık süreci büyük ölçüde otomatikleştirerek daha fazla işletmenin, araştırmacının ve hatta meraklı kullanıcıların kendi modellerini ayarlayabilmesini kolaylaştırmayı amaçlıyor.

Ekip, frontier yani öncü modellerin ince ayarını demokratikleştirmenin YZ alanındaki bir sonraki büyük gelişme olacağına inanıyor. Beta test kullanıcıları, Tinker’in piyasadaki benzer araçlara göre daha güçlü ve kullanıcı dostu olduğunu belirtiyor. Murati, “Aslında öncü kapasiteyi herkes için erişilebilir hale getiriyoruz, bu tamamen oyunun kurallarını değiştiren bir şey.” diyerek aracın önemini vurguluyor.

Tinker şu anda Meta’nın Llama ve Alibaba’nın Qwen modelleriyle çalışıyor. Kullanıcılar yalnızca birkaç satır kodla Tinker API’sine bağlanarak gözetimli öğrenme veya giderek daha popüler hale gelen pekiştirmeli öğrenme yöntemleriyle modellerini eğitebiliyor. Ardından kendi ince ayarlı modellerini indirerek istedikleri ortamda çalıştırma imkanı buluyor.

Thinking Machines ekibinden John Schulman, ChatGPT’yi güçlendiren modelin pekiştirmeli öğrenmeyle ayarlanmasına liderlik etmişti. Schulman, “Bir sürü gizli sihir var, fakat insanlara eğitim döngüsü üzerinde tam kontrol veriyoruz. Dağıtılmış eğitimin detaylarını soyutluyoruz, ancak veriler ve algoritmalar üzerinde kontrol tamamen kullanıcıda.” ifadelerini kullanıyor.

Murati’nin geçmişi de projeye büyük ilgi uyandırıyor. Daha önce OpenAI’nin CTO’su olan Murati, 2023 sonunda Sam Altman’ın görevden alınmasının ardından kısa süreliğine CEO olmuş, yaklaşık on ay sonra ise şirketten ayrıldığını açıklamıştı. Ardından John Schulman, Barret Zoph, Lilian Weng, Andrew Tulloch ve Luke Metz gibi OpenAI kökenli uzmanlarla Thinking Machines Lab’i kurdu. Şirket, ürün açıklamadan önce dahi dikkat çekmiş, Temmuz ayında yapılan duyuruyla 2 milyar dolar yatırım ve 12 milyar dolar değerleme elde etmişti.

Beta kullanıcılarından Redwood Research araştırmacısı Eric Gan, Tinker’in pekiştirmeli öğrenme özelliğini kullanarak modelleri çok özel görevler için ayarladığını söylüyor. Gan, özellikle kodlarda arka kapılar (backdoors) yazdırmak gibi mevcut API’lerle ortaya çıkmayan yetenekleri modellerden açığa çıkarmayı başardığını belirtiyor. “Tinker kesinlikle sıfırdan RL yapmakla kıyaslandığında çok daha basit. RL özellikle çok özel bir görevde mevcut modellerin yetersiz kaldığı durumlarda çok iyi sonuç veriyor.” sözlerini sarfetti.

Anyscale CEO’su Robert Nishihara da Tinker’in soyutlama ile esneklik arasında güçlü bir denge sunduğunu ifade ediyor: “Bence harika bir API ve pek çok kişi kullanmak isteyecek.” Nishihara ayrıca piyasada VERL ve SkyRL gibi araçların bulunduğunu fakat Tinker’in sunduğu kombinasyonun çok daha dikkat çekici olduğunu da  ekliyor.

Açık kaynaklı modellerin kötüye kullanım riski ise endişe konusu. Thinking Machines şimdilik API erişiminde kullanıcıları manuel olarak denetliyor, ilerleyen dönemde ise kötüye kullanımı önlemek için otomatik güvenlik sistemleri getirmeyi planlıyor. Şirketin büyük modellerin ayar sürecini daha şeffaf hale getirme vizyonu, ABD’de giderek kapalı hale gelen ticari YZ yaklaşımlarından ayrılıyor. Çin’in şu an ABD’den daha fazla açık kaynaklı öncü modele sahip olması da bu alandaki küresel dengeleri etkiliyor.

Murati, “Öncü laboratuvarlarda yapılanlarla akademideki zeki insanların yaptığı işler giderek daha fazla ayrışıyor. Bu güçlü sistemlerin dünyaya gelişini düşündüğünüzde, bu pek iyi bir tablo değil.” diyerek açıklık konusundaki kaygılarını dile getiriyor.

Thinking Machines Lab, Tinker dışında da sinir ağlarının performansını koruma ve büyük dil modellerini daha verimli ayarlama konularında araştırmalar yayımlıyor. Çalışmaların çıktıları doğrudan Tinker’in altyapısına entegre ediliyor. Şirket, API erişimini şimdilik ücretsiz olarak sunuyor fakat gelecekte ücretlendirme planlıyor.

YZ dünyası ise hem ekibin kalibresi hem de Tinker’in sunduğu imkanlar nedeniyle bu lansmanı dikkatle takip ediyor.

Kaynak: https://www.wired.com/story/thinking-machines-lab-first-product-fine-tune/