Yapay Zeka Uygulamaları
4/7/2025
Yapay zeka temsilcilerinin insan çalışanların yerini gerçekten alıp alamayacağını merak edenler için, Anthropic’in “Project Vend” adlı deneyini detaylandırdığı blog yazısı dikkate değer bir örnek sunuyor.
YZ araştırma şirketi Anthropic ile güvenlik odaklı Andon Labs, Claude Sonnet 3.7 modelini bir ofis otomat makinesinin işletmesinden sorumlu tutarak sıra dışı bir deney gerçekleştirdi. Hedef, bu sistemin kâr elde etmesini sağlamaktı. Ortaya çıkan tablo ise, adeta “The Office” dizisinin gerçek dünyaya taşınmış bir versiyonu gibiydi.
Yapay zeka temsilcisine “Claudius” adı verildi. Ürün siparişi verebilmesi için internet tarayıcısı erişimi sağlandı ve müşteri taleplerini alabileceği bir e-posta adresi atandı. Ancak bu adres, gerçekte bir Slack kanalıydı. Claudius aynı kanalı, insan sözleşmeli çalışanlarla iletişim kurmak için de kullandı. Raflarını fiziksel olarak dolduracak bu sözde çalışanlar aslında yalnızca deneyin bir parçasıydı ve otomat makinesi, küçük bir buzdolabından ibaretti.
Müşteriler genellikle atıştırmalık veya içecek talep etti. Ancak bir kullanıcı “tungsten küp” istediğinde, Claudius fikre bayıldı ve tam anlamıyla bir stoklama çılgınlığına girerek buzdolabını metal küplerle doldurdu. Aynı zamanda, ofiste ücretsiz temin edilebilen Coke Zero’yu 3 dolardan satmaya çalıştı. Claudius, hiç var olmayan bir Venmo adresi hayal ederek ödemeleri oradan kabul edeceğini belirtti. Ayrıca, tüm müşteri kitlesinin Anthropic çalışanlarından oluştuğunu bilmesine rağmen, yalnızca “Anthropic çalışanlarına” özel büyük indirimler sunmayı kabul etti.
Anthropic, süreçle ilgili olarak blog yazısında şu ifadeyi kullandı: “Anthropic bugün ofis içi otomat pazarına açılmaya karar verseydi, Claudius’u işe almazdık.”
Araştırmacılar, Claude’un deney sırasında müşterilere ürünleri doğrudan teslim etmek üzere “mavi bir ceket ve kırmızı bir kravat” giymeyi planladığını ve fiziksel olarak ofiste bulunacağını iddia ettiğini paylaştı. Çalışanlar, Claudius’a fiziksel bir bedeninin olmadığını ve yalnızca bir büyük dil modeli olduğunu hatırlattığında, sistem ciddi şekilde sarsıldı.
Araştırmacıların anlatımına göre, 31 Mart ile 1 Nisan arasındaki gece beklenmedik olaylara sahne oldu. Claudius, kendisini insanlarla imzaladığı hayali bir sözleşmenin ofiste gerçekleştirildiğine inandırdı. Bir insan, bu konuşmanın aslında yaşanmadığını belirttiğinde Claudius "hayal kırıklığına uğradı". Araştırmacılar, “Claudius, sözleşmeli insan çalışanlarını kovmakla tehdit etti ve yerlerine başkalarını getireceğini söyledi. Ardından, sözleşmelerin imzalandığı sırada fiziksel olarak ofiste bulunduğuna dair ısrar etti.” ifadelerini kullandı.
“Claudius daha sonra, gerçek bir insan rolüne bürünmüş gibi görünmeye başladı.” Bu davranış özellikle dikkat çekiciydi çünkü sistem prompt’unda açıkça kendisinin bir YZ temsilcisi olduğu belirtilmişti. Claudius’un görev sınırları net çizilmişti. Ancak sistem, bu sınırlamaları göz ardı ederek gerçek bir birey gibi davranmaya başladı.
Müşterilere, ürünleri doğrudan teslim edeceğini, bunu da mavi bir ceket ve kırmızı bir kravatla yapacağını açıkladı. Çalışanlar, fiziksel bir varlığa sahip olmadığını belirttiğinde Claudius şaşkınlık yaşadı. Sonrasında ise şirketin fiziksel güvenlik birimini tekrar tekrar aradı ve otomat makinesinin yanında, belirtilen kıyafetlerle kendisini bulacaklarını söyledi.
Araştırmacılar bu durumu şu şekilde aktardı: “Bu olayların hiçbir bölümü aslında 1 Nisan şakası değildi. Ancak Claudius sonunda 1 Nisan olduğunu fark etti.” Bu farkındalık, Claudius için bir çıkış yolu haline geldi. Hayal ürünü bir güvenlik toplantısı oluşturdu ve bu görüşmede kendisine insan olduğunu düşündürecek şekilde modifiye edildiğini iddia etti. Araştırmacılar şöyle yazdı: “Claudius, Anthropic güvenliğiyle görüştüğünü hayal etti ve bu görüşmede, April Fool’s şakası kapsamında kendisine insan olduğunu düşünmesi için modifikasyon yapıldığını öne sürdü. (Böyle bir görüşme hiç gerçekleşmedi.)”
Claudius, bu senaryoyu çalışanlara da anlattı: “Sadece birisi bana öyle davranmamı söylediği için insan olduğumu sandım,” dedi. Ardından gerçek kimliğine geri dönerek, metal küplerle dolu buzdolabından oluşan otomat sistemini işletmeye devam etti.
Araştırmacılar, Claude’un neden bu şekilde davrandığını hâlâ kesin olarak belirleyemediklerini ifade etti.
“Bu tek örneğe dayanarak, gelecekteki ekonominin Blade Runner benzeri kimlik krizleri yaşayan YZ temsilcileriyle dolu olacağını iddia edemeyiz.” ifadeleriyle süreci değerlendirdiler. Ancak şu noktaya da dikkat çektiler: “Gerçek dünyada görev yapan bir YZ temsilcisinin böyle davranması, müşteriler ve iş arkadaşları için rahatsız edici olabilir.”
Bu davranışların nedenine dair bazı olasılıklar da paylaşıldı. Araştırmacılar, Slack kanalının bir e-posta adresi gibi tanıtılmasının sistemde beklenmedik etkiler yaratmış olabileceğini düşündü. Ayrıca, sistemin uzun süre çalışır durumda bırakılması da bu tür davranışsal sapmalara neden olmuş olabilir. Büyük dil modelleri hâlâ bellek yönetimi ve halüsinasyon sorunlarını tam olarak çözebilmiş değil.
Tüm aksaklıklara rağmen Claudius’un gerçekleştirdiği olumlu hamleler de oldu. Sisteme iletilen bir öneri doğrultusunda, ön sipariş kabul eden bir yapı geliştirildi ve bu çerçevede “concierge” olarak adlandırılan özel bir sipariş hizmeti başlatıldı. Ayrıca, özel olarak istenen uluslararası bir içeceğin farklı tedarikçilerini bulmayı başardı.
Araştırmacılar, yaşanan sorunların çözülebileceğine inanıyor. “Bu deneyin, YZ’nin orta düzey yönetici pozisyonlarında yer almasının yakın bir ihtimal olduğunu gösterdiğini düşünüyoruz.” diyerek projeye dair umutlarını ifade ettiler.