ProGen3, Tek İstemle Etkili Antikorlar Üretiyor: İlaç Üretimi Hızlanıyor

Biyoteknoloji girişimi Profluent, yapay zekayı kullanarak protein tasarımı gerçekleştirdiği çalışmalarında, dil modellerinde olduğu gibi biyoloji alanında kullanılan YZ modelleri için de “ölçekleme yasaları” keşfettiğini açıkladı. Şirket, daha büyük modellerin daha fazla veriyle eğitilmesi durumunda daha öngörülebilir şekilde daha yüksek performans gösterdiğini ve küçük modellerin başaramayacağı görevlerin üstesinden gelebildiğini ortaya koydu.

Bu keşif, Profluent’in ve yatırımcılarının, gelecekte bilim insanlarının doğal dil aracılığıyla bir proteinin hangi özelliklere sahip olmasını istediklerini belirtip, YZ’nin buna uygun bir DNA dizilimi sunabileceği vizyonunun gerçekliğe dönüşeceğine dair güvenini artırıyor. Şirketin kurucusu ve CEO’su Ali Mandani, Fortune’a verdiği demeçte “Bu geleceğe doğru hızla ilerliyoruz.” ifadelerini kullandı.

Kaliforniya, Berkeley merkezli şirket bugüne kadar iki yatırım turunda toplam 44 milyon dolar sermaye topladı. Yatırımcıları arasında Spark Capital, Insight Partners ve Air Street Capital bulunuyor. Mevcut değerlemesi ise açıklanmadı.

Söz konusu gelişme yalnızca Profluent için değil, aynı zamanda benzer yaklaşımlarla protein tasarımı üzerine çalışan diğer girişimler için de umut verici. Profluent, büyük dil modellerinin (LLM) mimarisini proteinlere uygulayan birçok girişimden sadece biri. Google DeepMind’den ayrılarak Alphabet bünyesinde kurulan Isomorphic Labs, protein yapılarını DNA dizilimlerinden tahmin etmekte öncü oldu. Bu alanda ayrıca EvolutionaryScale (eski Meta AI araştırmacıları tarafından kuruldu), Ginkgo Bioworks, Cradle Bio, Evozyne ve Protai gibi girişimler de yer alıyor.

YZ’nin ilaç keşif süreçlerini hızlandırarak maliyetleri düşürmesi uzun süredir vadediliyor. Ancak bugüne kadar, yalnızca YZ tarafından keşfedilen hiçbir tedavi, insan klinik denemelerinin tüm aşamalarını tamamlayarak pazara ulaşamadı. Yine de faz 1 ve faz 2 klinik çalışmalarında yer alan adayların sayısı artıyor. Ayrıca YZ, mevcut ilaçların yeni hastalıklara uyarlanmasında da başarılı şekilde kullanıldı.

Profluent, son dönemde geliştirdiği ProGen3 adlı protein tasarım modelinin, yalnızca tek bir istem (prompt) üzerinden ticari olarak mevcut antikorlarla eşdeğer—hatta bazı durumlarda çok daha etkili—yeni antikorlar tasarlayabildiğini duyurdu. Tasarlanan bu antikorlar, hedef proteinlere bağlanma konusunda başarılı olurken, yapısal olarak patentli moleküllerden farklı olduğundan fikri mülkiyet ihlali riski de taşımıyor. Şirket, bu moleküllere “OpenAntibodies” adını verdi ve 20 tanesinin DNA dizilimini tamamen telifsiz ya da tek seferlik lisans ücretiyle kamuya açık hale getirmeyi planlıyor.

Şirket ayrıca, ProGen3’ü kullanarak Nobel ödüllü CRISPR-Cas9 sistemine alternatif olarak daha kompakt ve potansiyel olarak daha kolay uygulanabilir gen düzenleme proteinleri tasarladı. Cas9 proteini güçlü olsa da, yapısı oldukça büyük olduğu için tedavilerin taşıyıcısı olan mühendislik ürünü virüslerin içine gerekli RNA dizileriyle birlikte sığdırılması zorlaşıyor. Profluent’in tasarladığı yeni gen düzenleyici proteinler, bu sınırlamaları önemli ölçüde aşabiliyor. Geçtiğimiz yıl piyasaya sürdükleri OpenCRISPR-1 adlı gen düzenleyici protein, akademik ve ticari araştırmalarda kullanılmak üzere ücretsiz olarak sunulmuş ve birçok biyoloji araştırmacısı tarafından benimsenmişti.

Bugün yayımlanan çalışmayla birlikte Profluent, protein dil modellerinin, büyük dil modelleriyle benzer bir mimariye sahip olduğunu, ancak protein verileriyle eğitildiklerinde daha büyük olanlarının laboratuvar ortamında başarılı şekilde çalışan daha çeşitli proteinler üretebildiğini ortaya koydu. Ayrıca, bu büyük modeller araştırmacıların belirli protein özelliklerine (örneğin stabilite ya da hedefe bağlanma hızı/gücü) yönelik geri bildirimlerini çok daha hızlı öğrenebiliyor ve çıktılarında buna göre iyileşme sağlayabiliyor.

YZ alanında “ölçekleme yasaları” kavramı ilk olarak OpenAI araştırmacıları tarafından 2020’de ortaya atılmıştı. Bu kavrama göre, bir dil modeli büyütülüp daha fazla veriyle eğitildiğinde, performansı doğrudan buna paralel olarak artıyordu. Bu durum 2023’e kadar birçok büyük modelde geçerli oldu. Ancak son dönemde birçok önde gelen araştırma laboratuvarı, belirli bir model büyüklüğünden sonra daha fazla veriyle eğitmenin performansı anlamlı şekilde artırmadığını kabul etti. OpenAI’nin eski baş bilim insanı Ilya Sutskever, bu sınıra ulaşmanın sebebini “veri kıtlığı” olarak tanımlamıştı: Tüm internetin kazınıp eğitime dahil edilmesinden sonra, LLM’leri daha da geliştirecek yeterli insan üretimi veri kalmamıştı.

Buna yanıt olarak, YZ şirketleri model eğitimi yerine “çalışma zamanı hesaplama” (test time compute) yöntemine yöneldi. Bu yöntemde, modelin bir isteme verdiği yanıt yalnızca bir kez değil, çok sayıda alternatif çıktı üretilerek değerlendirilip en iyi sonuç seçiliyor. Bu da daha fazla işlem gücü gerektiriyor ama modelin başlangıçta büyütülmesini ya da daha fazla veriyle eğitilmesini gerektirmiyor. Araştırmacılar, bu yöntemin de kendi içinde “ölçekleme yasalarına” uyduğunu belirtiyor.

Profluent’in bulduğu biyolojik YZ modellerine ilişkin ölçekleme yasaları ise Mandani’ye göre özellikle eğitime dahil edilen veri miktarının gücüne dayanıyor. LLM’lerin aksine, protein dil modellerinde veri sıkıntısı yaşanmıyor. Örneğin, DeepMind’in AlphaFold 3 modeli, 214 milyon tam protein yapısıyla eğitildi. Oysa Profluent, en büyük modelini yaklaşık 3,4 milyar protein dizisi ile eğitti. Mandani’ye göre bu, neredeyse 10 kat daha fazla veri anlamına geliyor. Ayrıca şirketin şu anda 80 milyar protein dizisi içeren veri tabanlarına erişimi bulunuyor ve bu sayının kısa sürede iki katına çıkması bekleniyor.

Mandani bu durumu şöyle yorumluyor: “Biz ve başkaları için biyolojide sürekli ölçekleme yarışının başındayız. Bugünkü çalışmamız esasen bu yarışta ‘başlama işareti’ oldu.” Profluent’in konumunu OpenAI’nin 2019’da GPT-2’yi piyasaya sürmesiyle kıyaslayan Mandani, “Şu an neredeyse GPT-2 eşiğindeyiz. Bundan sonrasında neler olacağını hayal edin. Çok heyecan verici şeylerle karşınıza çıkacağız.” dedi.





Kaynak:https://fortune.com/2025/04/16/biotech-profluent-ai-scaling-laws-protein-design-models-opencrispr-openantibodies/