Yapay Zeka
7/2/2025
Derin öğrenme yapay zeka modelleri, tıbbi görüntü işleme ve konuşma tanıma gibi uygulamalarda büyük ve karmaşık veri yapıları üzerinde işlem yaparak çalışır. Ancak bu süreç, büyük miktarda hesaplama gücü gerektirdiğinden yüksek enerji tüketimine neden olur. MIT araştırmacıları, derin öğrenme algoritmalarını daha verimli hale getirmek için, geliştiricilerin aynı anda iki farklı veri fazlalığı türünden yararlanmasını sağlayan otomatik bir sistem oluşturdu. Bu yeni yaklaşım, makine öğrenimi işlemlerinde gereken hesaplama, bant genişliği ve bellek depolama ihtiyacını azaltıyor.
Mevcut algoritma optimizasyon teknikleri genellikle karmaşık ve zor uygulanabilir. Ayrıca, geliştiriciler ya yalnızca seyrek verileri (sparsity) ya da simetrik verileri (symmetry) optimize edebiliyordu, ancak bu iki optimizasyonun aynı anda gerçekleştirilmesi mümkün olmuyordu. MIT araştırmacılarının geliştirdiği SySTeC (Sparsity and Symmetry Tensor Compiler) sistemi, geliştiricilerin sıfırdan algoritmalar oluştururken hem simetriyi hem de seyrekliği aynı anda kullanmasına olanak tanıyor. Yapılan deneylerde, bu yöntemin hesaplama hızını neredeyse 30 kat artırabildiği gösterildi.
Sistem, kullanıcı dostu bir programlama dili kullanarak geliştirilmiş olması sayesinde, yalnızca derin öğrenme uzmanları için değil, veri işleme algoritmalarını daha verimli hale getirmek isteyen bilim insanları için de uygun bir çözüm sunuyor. Ayrıca, bilimsel hesaplamalar ve büyük ölçekli veri analizi alanlarında da kullanılabilecek potansiyele sahip.
MIT doktora sonrası araştırmacısı ve çalışmanın ortak yazarı Willow Ahrens, sistemin sunduğu avantajları şöyle açıklıyor:
"Uzun süredir, bu tür veri fazlalıklarını yakalamak büyük bir uygulama çabası gerektiriyordu. Ancak artık bir bilim insanı, sistemimize neyi hesaplamak istediğini daha soyut bir şekilde ifade edebilir ve sistem, nasıl hesaplanacağını otomatik olarak belirleyebilir."
Çalışma, MIT lisansüstü öğrencisi ve başyazar Radha Patel (’23, SM ’24), MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri Bölümü (EECS) profesörü ve Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL) baş araştırmacısı Saman Amarasinghe tarafından hazırlandı.
Makine öğrenimi uygulamalarında veriler, genellikle çok boyutlu diziler (tensor) olarak temsil edilir ve işlenir. Bir tensor, iki eksenli matrisler gibi verileri satır ve sütunlar halinde düzenleyen bir yapı olmasına rağmen, birden fazla boyuta sahip olabilir ve bu da işlemleri karmaşık hale getirir.
Derin öğrenme modelleri, bu çok boyutlu tensörler üzerinde tekrar eden matris çarpma ve toplama işlemleri gerçekleştirerek veri içindeki karmaşık desenleri öğrenir fakat işlem, çok büyük miktarda hesaplama gücü ve enerji gerektirir.
Ancak tensörlerdeki veri yapıları nedeniyle, mühendisler gereksiz hesaplamaları azaltarak bir sinir ağının hızını artırabilir.
Örneğin:
Ancak her iki optimizasyonu birden yakalamaya çalıştığınızda, süreç oldukça karmaşık hale gelir.Bu süreci kolaylaştırmak amacıyla, MIT araştırmacıları SySTeC adlı yeni bir derleyici (compiler) geliştirdi. SySTeC, simetri ve seyreklikten aynı anda faydalanarak hesaplamaları otomatik olarak optimize edebilen bir sistem sunuyor.SySTeC: Simetri ve Seyrekliğin Aynı Anda KullanılmasıAraştırmacılar, SySTeC’i geliştirirken, simetriyi kullanarak hesaplamaları nasıl optimize edebileceklerini belirleyen üç temel yöntem tanımladı:
Geliştiriciler SySTeC'e bir program girdiklerinde, sistem kodlarını tüm bu simetri türlerine göre otomatik olarak optimize eder. Ardından, sadece sıfır olmayan değerleri depolayarak kodu daha da optimize eden ikinci bir işlem aşaması gerçekleşir. Sonuç olarak, SySTeC tam anlamıyla çalıştırılmaya hazır bir kod üretir."Bu şekilde her iki optimizasyonun da avantajlarından yararlanabiliyoruz. Daha da ilginç olan ise, tensörünüz ne kadar fazla boyuta sahipse, hesaplama tasarrufu da o kadar artıyor." – Willow AhrensAraştırmacılar, SySTeC ile otomatik olarak üretilen kodların hızını test etti ve yaklaşık 30 kat hızlanma elde edildiğini gösterdi.Sistemin otomatikleştirilmiş olması, özellikle kendi yazdığı algoritmalarla veri işlemek isteyen bilim insanları için büyük bir avantaj sağlıyor.Araştırmacılar, SySTeC’i mevcut seyreklik optimizasyonuna odaklanan tensor derleyicilerine entegre ederek kullanıcılar için daha kapsamlı bir arayüz geliştirmeyi hedefliyor. Ayrıca, sistemi daha karmaşık programları optimize etmek için genişletmek istiyorlar.Bu çalışma, Intel, Ulusal Bilim Vakfı (National Science Foundation), Savunma İleri Araştırma Projeleri Ajansı (DARPA) ve ABD Enerji Bakanlığı tarafından desteklenmektedir.