Yapay Zeka
26/6/2025
Çinli araştırmacılar, yapay zekaya dayalı büyük dil modellerinin (LLM’ler), doğal nesneleri anlama ve sınıflandırma konusunda insana benzer bir sistem yaratabildiğini ilk kez doğruladı. Söz konusu süreç, insan bilişinin temel taşlarından biri olarak görülüyor. Elde edilen bulgular, yapay zeka modellerinin bilişsel kapasitesi üzerine süregelen tartışmalarda belirleyici bir aşamaya işaret ediyor.
Hakemli bilim dergisi Nature Machine Intelligence’ta yayımlanan makalede araştırmacılar şu değerlendirmeye yer verdi: “İnsanların doğal nesneleri nasıl kavramsallaştırdığı ve kategorize ettiği konusundaki anlayış, algı ve biliş açısından kritik içgörüler sunar.” Aynı çalışmada şu soru ortaya kondu: “Büyük dil modellerinin ortaya çıkışıyla birlikte temel bir soru beliriyor: Dilsel ve çok modlu verilerden, insana benzer nesne temsilleri geliştirilebilir mi?”
Büyük dil modelleri, çok büyük miktarda metin verisiyle — çok modlu modellerde ayrıca görsel ve ses verileriyle — eğitilerek çeşitli görevleri işleyebilecek yapay zeka sistemleridir. OpenAI’nin ChatGPT’si ve Google’ın Gemini’si gibi örnekler, çıkarım yapma, kavram aktarımı, nesne tanımlama ve bilgi sınıflandırma gibi alanlarda güçlü performans sergiliyor. Ancak önceki araştırmalar, analojik düşünme gibi daha derin bilişsel süreçlerde sınırlılıkların sürdüğünü göstermişti.
İnsan bilişinin temel yapı taşlarından biri olan “nesne temsiliyetine” sahip olmak, farklı nesneleri algılayıp onları kategorilere ve kavramlara atayabilme becerisini ifade eder. İnsanlar bir köpeği ya da elmayı gördüğünde yalnızca fiziksel özelliklerini değil, aynı zamanda anlamını, işlevini ve duygusal değerini de kavrayabilir. Derin öğrenme sistemlerinin, belirli bir görev için özel olarak eğitilmeksizin benzer temsilleri kendi başına oluşturma potansiyeli, uzun süredir araştırma ve tartışma konusu olmuştur.
Çin Bilimler Akademisi (CAS) Otomasyon Enstitüsü’nde görev yapan Profesör He Huiguang, salı günü yayımlanan açıklamada şunu söyledi: “Günümüzdeki yapay zeka kedi ile köpek resimlerini ayırt edebilir, ancak bu ‘tanımanın’ insanın kediler ve köpekler hakkındaki ‘anlayışından’ temel farkı hâlâ ortaya konmuş değil.”
Yapay zeka ile insan bilişi arasındaki ilişkiyi incelemeyi hedefleyen araştırma, CAS ile Güney Çin Teknoloji Üniversitesi iş birliğiyle gerçekleştirildi. Çalışma kapsamında davranış deneyleri, hesaplamalı modelleme ve beyin görüntüleme analizleri bir arada kullanıldı.
Araştırmacılar işe, üçlü seçim görevleriyle başladı: Katılımcılara ya da modellere aynı anda üç nesne sunularak, hangisinin diğer ikisinden farklı olduğu soruldu. ChatGPT-3.5 modeli yalnızca metin açıklamalarıyla, Gemini Pro Vision 1.0 ise görsel içerikle değerlendirme yaptı.
Toplamda 1.854 farklı gerçek dünya nesnesiyle ilgili 4,7 milyon üçlü karar toplanarak modellerin nesneler arası benzerlik yapılarına dair büyük bir veri elde edildi. Bu nesneler arasında hayvanlar, bitkiler, gıdalar, mobilyalar, giysiler ve araçlar yer aldı.
İnsanlara yönelik geliştirilmiş bir analiz yöntemiyle, modellerin yargılarının temelini oluşturan 66 farklı boyut tanımlandı. Bu boyutlar, sistemlerin doğal nesneleri nasıl sınıflandırdığını yansıtan genel yapıyı ortaya koydu.
Elde edilen boyutlar yalnızca “yiyecek” gibi kavramsal kategorilere değil; sıcaklık, doku, kullanım amacı (yetişkinler ya da çocuklar için), fiziksel bileşim ve kara-deniz ayrımı gibi çevresel özelliklere de işaret ediyordu.
Araştırmacılar, aynı nesneler için insanlar tarafından yapılan benzerlik yargılarıyla model çıktıları arasındaki örtüşmeyi karşılaştırdı. Özellikle anlamsal kategorilerde, insanlarla büyük dil modelleri arasında belirgin paralellik gözlemlendi. Görsel özelliklere dayalı alanlarda ise dil temelli modellerin sınırlı olduğu görüldü. Ancak çok modlu modeller, insan bilişiyle daha yüksek oranda örtüşme gösterdi.
Ekip ayrıca buldukları bir bulguyu paylaştı: “Daha ileri analizler, model gömülümleri ile parahipokampal bölge gibi çevresel sahnelerin kodlanması ve tanınmasında görevli beyin bölgelerindeki sinirsel etkinlik örüntüleri arasında güçlü bir hizalanma olduğunu gösterdi.” Bu durum, çok modlu modelin oluşturduğu temsillerin, insan beyninin nesne kavrama sürecine benzer mekanizmalarla üretilebildiğine işaret ediyor.
Araştırmanın genel sonucu şu şekilde ifade edildi: “LLM’lerdeki nesne temsilleri, insan temsilleriyle aynı olmasa da, insan kavramsal bilgisinin temel yönlerini yansıtan yapısal benzerlikler sergiliyor. Bu da güçlü bir kanıt sunuyor.”
Bulunan veriler insan benzeri yapay bilişsel sistemlerin ve daha doğal insan-makine arayüzlerinin geliştirilmesine katkı sağlayabilir. Araştırmacılar, bu tür yaklaşımların özellikle akıllı robotlar gibi ileri düzey sistemlerde kullanılabilecek daha sezgisel yapay zeka çözümlerinin önünü açabileceğini vurguluyor.