Yapay Zeka
20/1/2025
Yapay zekanın bilime katkılarını düşündüğünüzde, muhtemelen geçen yıl yaratıcısına Nobel Ödülü kazandıran Google DeepMind protein katlama programı AlphaFold'u düşünüyorsunuz. Şimdi OpenAI da protein mühendisliği için bir modelle bilim alanına giriş yapıyor. Şirket, normal hücreleri kök hücrelere dönüştürebilen proteinleri hayal eden bir dil modeli geliştirdiğini ve bu görevde insanları rahatlıkla yendiğini söylüyor. Çalışma, OpenAI'nin biyolojik verilere odaklanan ilk modeli ve modellerinin beklenmedik bilimsel sonuçlar verebileceğine dair ilk kamuoyu açıklamasını temsil ediyor. Bu nedenle, bu bazıları tarafından "yapay genel zeka"ya giden yolda önemli bir test olarak kabul edilen, yapay zekanın gerçek keşifler yapabileceğini belirlemek için bir adımdır.
Geçtiğimiz hafta OpenAI CEO'su Sam Altman, şirketinin bir AGI'nin nasıl inşa edileceğini bildiğinden “emin” olduğunu söyledi ve “süper zeki araçlar, bilimsel keşif ve inovasyonu kendi başımıza yapabileceklerimizin çok ötesinde büyük ölçüde hızlandırabilir” diye ekledi.
Protein mühendisliği projesi bir yıl önce San Francisco merkezli bir uzun ömür araştırma şirketi olan Retro Biosciences'in OpenAI'ye birlikte çalışma konusunda başvurmasıyla başladı. Bu bağlantı tesadüfen gerçekleşmedi. OpenAI'nin CEO'su Sam Altman, MIT Technology Review'un ilk kez 2023'te bildirdiği gibi, Retro'yu 180 milyon dolarla kişisel olarak finanse etti.
Retro, normal insan ömrünü 10 yıl uzatmayı hedefliyor. Bunu gerçekleştirmek için, Yamanaka faktörleri adı verilen proteinleri inceliyorlar. Proteinler, bir insan deri hücresine eklendiğinde, hücreyi genç görünen bir kök hücreye dönüştürüyor. Kök hücreler, vücuttaki diğer tüm dokuları üretebilen bir hücre türüdür.
Bu, Retro'daki araştırmacılar ve Altos Labs gibi zengin bir şekilde finanse edilen şirketlerdeki araştırmacılar tarafından, hayvanları gençleştirmek, insan organları oluşturmak veya yedek hücre tedarikleri sağlamak için olası bir başlangıç noktası olarak görülmektedir fakat söz konusu türde hücre "programlaması" çok verimli değildir. Birkaç hafta sürmektedir ve laboratuvar ortamında tedavi edilen hücrelerin %1'inden daha azı gençleşme yolculuğunu tamamlayabilmektedir.
OpenAI'nin GPT-4b micro adı verilen yeni modeli, işlevlerini artırmak için protein faktörlerini yeniden tasarlamanın yollarını önermek üzere eğitildi. OpenAI'ye göre, araştırmacılar modelin önerilerini kullanarak Yamanaka faktörlerinden ikisini 50 kattan fazla etkili olacak şekilde değiştirdi - en azından bazı ön ölçümlere göre.
OpenAI araştırmacılarından John Hallman, “Genel olarak proteinler, bilim insanlarının kendi başlarına üretebildiklerinden daha iyi görünüyor.” diyor.
Hallman ve OpenAI'den Aaron Jaech'in yanı sıra Retro'dan Rico Meinl modelin baş geliştiricileriydi.
Dışarıdaki bilim insanları, sonuçların gerçek olup olmadığını yayınlanana kadar söyleyemeyecekler, şirketlerin planladığını söylüyorlar. Model daha geniş kullanım için de mevcut değil - hala özel bir gösteri, resmi bir ürün lansmanı değil.
Jaech, “Bu proje bilime katkıda bulunma konusunda ciddi olduğumuzu göstermeyi amaçlıyor” diyor. “Ancak bu yetenekler dünyaya ayrı bir model olarak mı sunulacak yoksa ana hat akıl yürütme modellerimize mi dahil edilecek, bu henüz belirlenmedi.”
Model, proteinlerin hangi şekli alacağını tahmin eden Google'ın AlphaFold modeli ile aynı şekilde çalışmıyor. OpenAI, Yamanaka faktörlerinin alışılmadık derecede dalgalı ve yapılandırılmamış proteinler olduğu için, büyük dil modellerinin uygun olduğu farklı bir yaklaşım gerektirdiğini söyledi.
Model, birçok türden protein dizisi örnekleri ve hangi proteinlerin birbirleriyle etkileşime girme eğiliminde olduğu bilgisiyle eğitildi. Bu çok miktarda veri olsa da, OpenAI'nin amiral gemisi sohbet robotlarının eğitildiği verilerin sadece bir kısmı, GPT-4b'yi odaklanmış bir veri setiyle çalışan "küçük bir dil modeli" örneği haline getiriyor.
Retro bilim adamları modele sahip olduktan sonra, Yamanaka proteinlerinin olası yeniden tasarımlarını önermek için onu yönlendirmeye çalıştılar. Kullanılan yönlendirme taktiği, bir kullanıcının bir chatbot'a bir dizi örnek sunarak cevapları sorguladığı ve ardından botun yanıt vermesi için bir örnek sunduğu “birkaç atış” yöntemine benzemekte.
Genetik mühendisleri laboratuvarda moleküllerin evrimini yönlendirmenin yollarına sahip olsalar da, genellikle yalnızca çok sayıda olasılığı test edebilirler. Tipik uzunluktaki bir protein bile neredeyse sonsuz şekilde değiştirilebilir (çünkü yüzlerce amino asitten oluşurlar ve her asidin 20 olası çeşidi vardır) ancak OpenAI'nin modeli genellikle proteinlerdeki amino asitlerin üçte birinin değiştirildiğine dair öneriler ortaya koyuyor.