Yapay Zeka
13/11/2025

Microsoft, Wisconsin ve Atlanta’daki iki büyük veri merkezini birbirine bağlayarak YZ süper fabrikası olarak tanımladığı yeni altyapıyı devreye aldı. Fairwater veri merkezleri adı verilen tesisler, ortak tasarım ve mimari sayesinde tek bir dev sistem gibi çalışarak yeni YZ modellerinin eğitim süresini aylardan haftalara indiriyor. Söz konusu ağ, OpenAI ve Microsoft AI Superintelligence Team için gelişmiş GPU kümeleri üzerinde dev eğitim görevlerini hızlandırmak amacıyla tasarlandı. Azure altyapısından sorumlu genel müdür Alistair Speirs, yapıyı “Tek bir tesiste mümkün olmayan görevleri çözmek için sanal bir süper bilgisayar gibi çalışan dağıtık bir ağ inşa ediyoruz.” sözleriyle tanımlıyor.
YZ modelleri her nesilde büyüdükçe, parametre sayıları trilyon seviyelerine çıkıyor ve öğrenme için kullanılan referans veri kümeleri hızla genişliyor. Bu durum, tek bir veri merkezinin eğitim yükünü tek başına taşımasını zorlaştırıyor. Fairwater yapısı, farklı lokasyonlardaki tesislerin tek bir model eğitimi için ortak çalışmasını sağlayarak gelecekte yüzlerce trilyon parametre içeren modellerin dahi eğitilebilmesini mümkün hâle getiriyor.

Speirs, klasik veri merkezleriyle süper fabrika arasındaki farkı “Geleneksel bir veri merkezi milyonlarca küçük uygulamayı çalıştırır; süper fabrika ise tek bir karmaşık görevi milyonlarca donanım bileşeni üzerinde yürütür.” sözleriyle açıklıyor. Yeni modelde her tesis, aynı YZ eğitimi için gerekli iş yükünün bir parçasını üstleniyor. Böylece Fairwater, dev model eğitimini hızlandıran dağıtık ama tekil bir sistem oluşturuyor.
Fairwater merkezleri, yüz binlerce NVIDIA Blackwell GPUya ölçeklenebilen NVIDIA GB200 NVL72 raf ölçekli sistemlerini kullanıyor. Yeni çip ve raf mimarisi, mevcut bulut platformları içinde raf başına en yüksek veri işleme kapasitesini sunuyor. Tesislerde iki katlı GPU yerleşimi ve su tüketimini minimuma indiren gelişmiş sıvı soğutma sistemi bulunuyor. Microsoft Cloud + YZ başkan vekili Scott Guthrie, “YZ’de liderlik yalnızca daha fazla GPU eklemek demek değil; hepsinin tek bir sistem gibi çalışmasını sağlayan altyapıyı kurmak gerekir.” ifadesini paylaşıyor. Gelecekte tüm Fairwater tesisleri, özel optik hatlardan oluşan AI WAN üzerinden ışık hızında veri akışıyla birbirine bağlanacak.
Microsoft, 34 milyar dolarlık sermaye harcamasının önemli kısmını veri merkezleri ve GPU altyapısına ayırarak YZ hesaplama talebini karşılamayı hedefliyor. Amazon gibi rakipler de Indiana’daki Project Rainer ile benzer yönde ilerliyor. Meta, Google, OpenAI ve Anthropic ise yeni tesisler, özel çipler ve gelişmiş sistemler için onlarca milyar dolarlık yatırımlar yapıyor. Bazı analistler YZ alanındaki yatırım hızını bir balon olarak değerlendirirken, Microsoft uzun vadeli kurumsal sözleşmelerin talebi sürekli artırdığını belirtiyor.
Kaynak: https://interestingengineering.com/innovation/microsoft-ai-superfactory