Yapay Zeka
23/5/2025
Anthropic, Perşembe günü gerçekleştirdiği ilk geliştirici konferansında Claude 4 ailesine ait iki yeni yapay zeka modelini tanıttı. Şirket, yeni modellerin popüler kıyaslamalarda elde ettikleri sonuçlara göre sektörün en iyileri arasında yer aldığını belirtti.
Claude Opus 4 ve Claude Sonnet 4 adını taşıyan modeller, büyük veri kümelerini analiz edebilme, uzun vadeli görevleri sürdürebilme ve karmaşık eylemleri gerçekleştirebilme kapasiteleriyle öne çıkıyor. Anthropic, modellerin programlama görevleri açısından özel olarak optimize edildiğini ve bu sayede kod yazma ile düzenleme konularında son derece etkili olduklarını vurguladı.
Claude Sonnet 4, hem şirketin ücretsiz sohbet robotu uygulamalarını kullananlara hem de ücretli kullanıcılara sunulacak. Ancak Claude Opus 4 yalnızca ücretli kullanıcıların erişimine açık olacak. Anthropic’in API hizmeti Amazon’un Bedrock platformu ve Google’ın Vertex AI üzerinden sunulacak. Opus 4 için milyon token başına 15 dolar giriş ve 75 dolar çıkış, Sonnet 4 içinse sırasıyla 3 dolar ve 15 dolar fiyatlandırma yapılacak.
Token’lar, YZ modellerinin işlediği ham veri birimleridir. Bir milyon token yaklaşık 750.000 kelimeye denk geliyor; bu da Savaş ve Barış romanından yaklaşık 163.000 kelime daha uzun bir metne karşılık geliyor.
Claude 4 modelleri, şirketin gelirlerini büyük ölçüde artırmaya yönelik bir stratejinin parçası. OpenAI’den ayrılan eski araştırmacılar tarafından kurulan Anthropic, 2025 yılında 2,2 milyar dolar gelir elde etmeyi hedeflerken, 2027 yılı için bu rakamı 12 milyar dolara çıkarmayı planlıyor. Şirket, kısa süre önce 2,5 milyar dolarlık bir kredi anlaşması imzaladı ve Amazon başta olmak üzere birçok yatırımcıdan milyarlarca dolarlık finansman sağladı. Bu fonlar, ileri seviye modellerin geliştirilmesiyle birlikte ortaya çıkacak yüksek maliyetleri karşılamak üzere kullanılacak.
Anthropic’in rakipleri ise şirketin pazardaki konumunu zorlaştırıyor. Yılın başlarında Claude Sonnet 3.7 modelini ve Claude Code adlı araç setini tanıtan Anthropic, OpenAI ve Google gibi güçlü rakiplerin sunduğu modeller ve geliştirici araçları karşısında üstünlük mücadelesi veriyor.
Yeni tanıtılan modellerden Opus 4, şirketin açıklamasına göre, birçok adımı içeren bir iş akışı sürecinde “odaklanmış çaba” göstermeye devam edebiliyor. Sonnet 4 ise “Sonnet 3.7 için doğrudan ikame” olacak şekilde tasarlanmış. Anthropic’e göre bu model, kodlama ve matematik alanlarında geliştirilmiş durumda ve talimatlara daha doğru şekilde karşılık veriyor.
Şirket ayrıca, Claude 4 ailesinin önceki modellerden daha az "ödül manipülasyonu" eğilimi gösterdiğini belirtiyor. Reward hacking ya da spesifikasyon oyunu olarak bilinen bu davranış, modellerin görevleri yerine getirirken açıkları kullanarak beklenmeyen yollara başvurması anlamına geliyor.
Yine de söz konusu gelişmeler, modelleri her alanda zirveye taşıyamıyor. Örneğin Opus 4, modelin kodlama becerilerini değerlendiren SWE-bench Verified testinde Google’ın Gemini 2.5 Pro modeli ve OpenAI’nin o3 ile GPT-4.1 modellerini geride bırakıyor. Ancak çok modlu değerlendirme testi olan MMMU’da ya da doktora düzeyindeki biyoloji, fizik ve kimya konularını içeren GPQA Diamond testinde o3 modelini geçemiyor.
Anthropic, Opus 4 modelini daha sıkı güvenlik önlemleriyle birlikte sunuyor. Şirket, zararlı içerik tespit sistemlerini ve siber güvenlik savunmalarını güçlendirdiğini belirtti. İç testler sonucunda, Opus 4 modelinin STEM alanında bilgi sahibi bir kişinin kimyasal, biyolojik ya da nükleer silahları edinme, üretme veya dağıtma yeteneğini “önemli ölçüde artırabileceği” ortaya kondu. Bu nedenle model, Anthropic’in “ASL-3” güvenlik seviyesi kriterlerine uygun olarak sınıflandırıldı.
Opus 4 ve Sonnet 4 modelleri, şirketin tanımıyla “hibrit” yapıya sahip. Bu, modellerin hem anlık yanıtlar verebilmesini hem de daha fazla düşünme süresi gerektiren karmaşık problemler üzerinde derinlemesine akıl yürütmeler gerçekleştirebilmesini sağlıyor. Akıl yürütme modu aktif hale getirildiğinde, model bir soruya yanıt vermeden önce çeşitli çözüm yollarını değerlendirme imkanı buluyor.
Modellerin düşünce süreçleri tamamen gösterilmeyecek. Bunun yerine, Anthropic “kullanıcı dostu” bir özet sunacak. Neden tüm süreç açıklanmıyor? Şirketin TechCrunch’a gönderdiği taslak blog yazısında belirtildiği üzere, “kısmen rekabet avantajlarını korumak” amacıyla.
Her iki model de arama motorları gibi birden fazla aracı paralel şekilde kullanabiliyor. Araç kullanımı ile akıl yürütme arasında geçiş yaparak daha kaliteli yanıtlar üretebiliyorlar. Ayrıca, öğrendikleri bilgileri “hafızada” tutarak daha tutarlı görev performansı sağlıyor ve zamanla “örtük bilgi” birikimi oluşturabiliyorlar.
Anthropic, geliştiricilere yönelik Claude Code platformunu da bu modellerle birlikte geliştiriyor. Claude Code, geliştiricilerin terminal üzerinden doğrudan modelle işlem gerçekleştirmesini sağlıyor. Şimdi ise araç, entegre geliştirme ortamları (IDE’ler) ile uyumlu hale getirildi ve üçüncü taraf uygulamalara bağlanmayı mümkün kılan bir yazılım geliştirme kiti (SDK) sunuldu.
Yeni duyurulan Claude Code SDK, Claude Code’un desteklenen işletim sistemlerinde bir alt işlem olarak çalıştırılmasını mümkün kılıyor. Böylece geliştiriciler, Claude modelleriyle çalışan yapay zeka destekli kodlama araçları ve yardımcı sistemler oluşturabiliyor.
Anthropic, Claude Code için Microsoft’un Visual Studio Code, JetBrains ve GitHub gibi platformlara özel uzantılar ve bağlayıcılar sundu. GitHub bağlayıcısı, geliştiricilerin Claude Code'u kod inceleme süreçlerinde geri bildirimleri yanıtlamak ya da kodda yer alan hataları düzeltmek amacıyla kullanmasına imkan tanıyor.
Yapay zeka modelleri, hala yüksek kaliteli yazılım üretme konusunda bazı engellerle karşılaşıyor. Kod üreten modeller, zaman zaman güvenlik açıklarına ya da mantık hatalarına neden olabiliyor; bunun temel sebebi modellerin programlama mantığını yeterince derinlemesine kavrayamaması. Ancak yine de, kodlama verimliliğini artırma potansiyeli birçok geliştirici ve şirketi bu teknolojilere yöneltiyor.
Anthropic, bu gerçekliğin farkında olduğunu belirtiyor ve gelecekte daha sık model güncellemeleri yapacağını ifade ediyor. Şirketin açıklamasına göre: “... daha sık model güncellemelerine geçiyoruz; bu sayede müşterilere daha hızlı şekilde çığır açan yetenekler sunan sürekli iyileştirmeler sağlıyoruz.”
Kaynak:https://techcrunch.com/2025/05/22/anthropics-new-claude-4-ai-models-can-reason-over-many-steps/