Teknoloji

17/4/2025

Panasonic ve UC Berkeley'den Etkileşimli Görüntü Tanıma Teknolojisi: SegLLM Tanıtıldı

Panasonic R&D Company of America (PRDCA) ve Panasonic Holdings Co., Ltd. (Panasonic HD), Kaliforniya Üniversitesi Berkeley (UC Berkeley) araştırmacılarıyla iş birliği içinde geliştirdiği yeni bir etkileşimli segmentasyon teknolojisini duyurdu. "SegLLM" adı verilen bu teknoloji, kullanıcıların tanıma hedeflerini hem doğal dil hem de referans görseller aracılığıyla belirlemesine olanak tanıyor.

Segmentasyon, bir görüntüyü piksel düzeyinde çoklu bölgelere ayıran bir teknoloji. Görüntü tanıma ile entegre edildiğinde, belirli nesneleri tespit etmeyi ve bu nesnelerin konumunu ve şeklini hassas şekilde belirlemeyi mümkün kılıyor. Böylelikle fabrikalardaki nesne tanıma sistemlerinden, araç çevresi algılamaya ve robotların nesne işleme kabiliyetine kadar çok çeşitli alanlarda kullanılabilmesini sağlanıyor.

Mevcut VLM'de, karmaşık istem yanlış tanımaya yol açabilir

Son dönemde görüntü tanıma alanında, büyük dil modelleri (LLM'ler) aracılığıyla metin tabanlı tanımlama eğilimi artmıştır. Ancak etkileşimli kullanım senaryolarında, yeni komutların daha önce tanınmış nesnelere dayalı olarak verilmesi metinleri karmaşıklaştırmakta ve yanlış tanıma olasılığını artırmaktadır.

Geliştirilen SegLLM teknolojisi söz konusu sorunu çözmekte. Kullanıcının hem metin hem de referans görsellerle komut verebilmesini sağlayarak, nesneler arasındaki hiyerarşik ilişkileri ve etkileşimleri tanıma yeteneğini kazandırır. Böylece daha önce eğitim verisiyle tanıtılmamış nesneler dahi tanımlanabilir. Ayrıca birbirine çok benzeyen nesnelerin yer aldığı karmaşık sahnelerde yalnızca hedef nesnelerin tanınmasını da mümkün kılar.

SegLLM, ileri düzeydeki bu özellikleri sayesinde uluslararası alanda da takdir topladı. Yapay zeka ve makine öğrenimi alanındaki en prestijli konferanslardan biri olan Uluslararası Temsili Öğrenme Konferansı’na (ICLR 2025) kabul edilen çalışma, 24-28 Nisan 2025 tarihleri arasında Singapur’da düzenlenecek etkinlikte sunulacak.

Kaynak:https://news.panasonic.com/global/press/en250417-2?utm_source=chatgpt.com