![]() |
▲AI 아티스트 ‘칼로’ 모델에 제시어 입력 시 생성된 샘플 이미지. |
‘칼로’는 카카오브레인이 공개한 ‘minDALL-E’, ‘RQ-Transformer’ 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트다. 1억2000만 장 규모의 텍스트-이미지 데이터셋을 학습해 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성할 수 있다.
예를 들어 "르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자"라는 제시어를 입력하면 ‘칼로’가 제시어의 맥락을 이해하고 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 상상해 이미지를 그려낸다. 기존에 존재하던 이미지를 찾아내는 것이 아니라, AI가 스스로 제시어를 이해하고 직접 이미지를 생성해내는 것이다.
카카오브레인은 AI 아티스트 ‘칼로’의 활용 분야가 무궁무진하다고 강조한다. 교육 및 발표 준비에 필요한 시각 자료 제작에 활용해 전달하고자 하는 메시지의 설득력을 높일 수 있고, 신규 브랜드 로고 디자인 및 구조물 디자인 등 고도의 창의성을 요하는 산업군에서 영감을 주는 예술 도구로 활용할 수도 있다.
카카오브레인은 내년 초 개선된 품질과 기능이 추가된 ‘칼로’ 모델을 오픈 응용프로그램인터페이스(API) 형태로 공개하며 사용자의 접근성을 높여갈 예정이다. 또 지속적으로 텍스트-이미지 데이터셋 추가 학습을 진행하는 한편, 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 ‘이미지 인페인팅’, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅’ 등 다양한 기능을 추가해 성능을 고도화해 나갈 계획이다.
앞서 카카오브레인은 지난 10월 AI 아티스트 ‘칼로’를 활용해 국내 최초 AI 이미지 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 무료 공개하기도 했다.
김일두 카카오브레인 대표는 "앞으로도 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것"이라고 말했다.
sojin@ekn.kr