Yapay Zeka Uygulamaları
2/7/2025
Microsoft, yeni geliştirdiği yapay zeka sisteminin hastalıkları insan doktorlardan dört kat daha doğru ve düşük maliyetle teşhis edebildiğini açıkladı. Şirketin yapay zeka birimi CEO’su Mustafa Süleyman, “tıbbi süper zekaya yönelik gerçek bir adım” attıklarını belirtti.
Sistemin performansı, insan doktorların yaptığına benzer bir teşhis sürecini taklit ederek test edildi. Microsoft araştırmacıları, New England Journal of Medicine’dan alınan 304 vaka çalışmasına dayanarak “Sequential Diagnosis Benchmark” adlı bir test oluşturdu. Büyük dil modeli, her vakayı bir doktorun izleyeceği adımlarla analiz etti.
Ardından, MAI Diagnostic Orchestrator (MAI-DxO) adı verilen sistem geliştirildi. Sistem, OpenAI'nin GPT'si, Google'ın Gemini’si, Anthropic’in Claude’u, Meta’nın Llama’sı ve xAI’nin Grok’u gibi modelleri bir araya getirerek insan uzmanların birlikte çalışmasını taklit etti.
Test sonuçlarına göre, MAI-DxO %80 doğruluk oranıyla %20’de kalan insan doktorları geride bıraktı. Ayrıca teşhis için daha ucuz testleri seçerek maliyetleri %20 oranında azalttı. Süleyman, “Bu tür çoklu temsilcilerin tartışma zinciri gibi birlikte çalışması, bizi tıbbi süper zekaya yaklaştıracak.” dedi.
Microsoft bu projede Google’dan birçok YZ araştırmacısını transfer etti. YZ sistemlerinin halihazırda ABD sağlık sisteminde kullanıldığı, ancak bu projenin çok daha kapsamlı ve gerçek doktor sürecine yakın olduğu vurgulandı. Microsoft, teknolojinin ticari kullanımına ilişkin henüz bir karar vermedi ancak Bing’e entegre edilebileceği ya da sağlık profesyonellerine yönelik araçlara dönüştürülebileceği ifade edildi.
MIT’den David Sontag, çalışmanın yöntemsel titizliğini ve doktorların işleyiş biçimini yakalamasını övgüyle karşıladı ancak testte doktorlara ek araç kullanma izni verilmemesinin, gerçek uygulamayla tam örtüşmeyebileceğini vurguladı. Scripps Research Institute’tan Eric Topol ise “Bu çalışma, teoride YZ’nin sağlık hizmeti maliyetlerini düşürebileceğini göstermesi açısından önemli.” dedi.
Uzmanlar, sistemin genel kullanıma geçmeden önce gerçek klinik denemelerle değerlendirilmesi gerektiğini belirtiyor. Sontag, “Ancak bu şekilde maliyet etkinliğini gerçekten değerlendirmek mümkün olabilir.” dedi.
Kaynak: https://www.wired.com/story/microsoft-medical-superintelligence-diagnosis/