김준모 교수팀, 스스로 이미지 세부특징 이해 ‘범용 시각 AI 모델’ 개발
기존 기법 대비 42% 성능 우수…AI 응용분야서 높은 활용 가능성 기대
카이스트(KAIST) 연구진이 인간의 인지 방식을 모방해 이미지 변화를 이해하고 시각적 일반화와 특정성을 동시에 확보하는 인공지능(AI) 기술을 개발했다. 이 기술은 의료 영상 분석, 자율주행, 로보틱스 등 다양한 분야에서 이미지를 이해해 객체를 분류·탐지하는데 활용될 수 있을 것으로 기대된다.
14일 KAIST(총장 이광형)에 따르면 전기및전자공학부 김준모 교수 연구팀은 변환 레이블 없이도 스스로 변환 민감 특징을 학습할 수 있는 새로운 시각 인공지능 모델 'STL'을 개발했다.
연구팀이 개발한 시각 인공지능 모델 STL은 스스로 이미지의 변환을 학습, 이미지 변환의 종류를 인간이 직접 알려주면서 학습하는 기존 방법들보다 높은 시각 정보 이해 능력을 보였다.
특히, 기존 방법론들을 통해 학습한 모델이 이해할 수 없는 세부적인 특징까지도 학습하여 기존 방법 대비 최대 42% 우수한 성능을 보여줬다.
STL은 변환 라벨 없이 변환 정보를 학습할 수 있도록 설계된 새로운 학습 기법으로, 라벨 없이 변환 민감 특징을 학습할 수 있다. 또한, 기존 학습 방법 대비 학습 복잡도를 유지한 채로 효율적인 최적화할 수 있는 방법을 제안했다.
실험 결과, STL은 정확하게 객체를 분류하고 탐지 실험에서 가장 낮은 오류율을 기록했다. 또한, STL이 생성한 표현 공간은 변환의 강도와 유형에 따라 명확히 군집화되어 변환 간 관계를 잘 반영하는 것으로 나타났다.
김준모 교수는 “이번에 개발한 STL은 복잡한 변환 패턴을 학습하고 이를 표현 공간에서 효과적으로 반영하는 능력을 통해 변환 민감 특징 학습의 새로운 가능성을 제시했다"며 "라벨 없이도 변환 정보를 학습할 수 있는 기술은 다양한 AI 응용 분야에서 핵심적인 역할을 할 것"이라고 말했다.
KAIST 전기및전자공학부 유재명 박사과정이 제1저자로 참여한 이번 연구는 최고권위 국제학술지 '신경정보처리시스템학회(NeurIPS) 2024'에서 올해 12월 발표될 예정이다.
이 논문은 2024년도 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구 성과물(지속가능한 실시간 멀티모달 인터렉티브 생성 AI 개발, SW스타랩)이다.