AI산업

김일두 카카오브레인 대표 "세계 최대 규모 AI 멀티모달 모델 곧 공개할 것"

AI타임스 2021. 12. 20. 13:38

초거대 AI 멀티모달 '민달리' 공개한 지 이틀 만에
텍스트와 이미지 동시에 다루는 AI 기술
LG AI 연구원의 '엑사원'과 경쟁 구도 예상
"시각적 정보와 텍스트 정보의 결합 많아질 것"

 

김일두 카카오브레인 대표는 "글로벌 최대 규모 멀티모달 데이터셋을 구축하고 모델과 함께 공개할 계획"이라고 밝혔다. (출처=카카오브레인, 편집=김동원 기자)

김일두 카카오브레인 대표가 세계 최대 규모 멀티모달(multi-modality) 공개를 예고했다. 초거대 AI 멀티모달 '민달리(minDALL-E)'를 글로벌 오픈소스 커뮤니티인 깃허브에 공개했다고 밝힌 지 이틀 만이다.

 

김일두 대표는 17일 열린 '오픈 미니 컨퍼런스'에서 "글로벌 최대 규모 멀티모달 데이터셋을 구축하고 모델과 함께 공개할 계획"이라며 "이 기반이 되는 최고 수준의 인프라를 구축하는 사업을 진행해 원 엑사플롭(exaflops)이 넘는 인프라를 구축하고 연구에 활용하고 있다"고 밝혔다.

 

멀티모달은 언어뿐만 아니라 이미지, 영상에 이르기까지 사람의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 기술을 의미한다. 카카오브레인은 지난 15일 AI 멀티모달 모델 중 하나로 민달리를 공개한 바 있다.

 

민달리는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성모델이다. "바나나 껍질로 만든 의자 그려줘", "보름달과 파리 에펠탑이 같이 있는 그림 보여줘", "살바도르 달리 화가 스타일로 그려줘"와 같은 명령어를 입력하면 AI가 텍스트 맥락을 이해하고 바로 이미지를 만들어준다. 검색을 통해 이미지를 찾아내는 방식이 아니라 AI가 텍스트 명령을 스스로 이해하고 직접 이미지를 그리는 방식이다.

 

김 대표는 민달리가 그린 그림 중 가장 좋아하는 것은 바나나 의자라고 밝혔다. 이 그림은 바나나 껍질을 말아서 의자처럼 표현한 그림이다. 그는 "바나나 모양을 한 의자라는 말을 들었을 때 바나나 껍질을 말아서 의자로 만들 생각을 할 사람이 몇이나 될까요?"라며 "(이 그림은) 인간이 상상력을 자극하는 즐거운 결과물"이라고 말했다.

 

카카오브레인의 '민달리'가 텍스트를 이해 후 그린 그림들. 맨 오른쪽 아래 그림이 '민달리'가 그린 바나나 의자다. (출처=카카오브레인 행사 캡처)

카카오브레인이 민달리에 이어 세계 최대 규모 멀티모달을 공개할 계획을 밝히면서 AI 모델을 공급하는 주요기업의 경쟁은 더 가속화될 것으로 전망된다.

 

LG그룹의 LG AI 연구원은 카카오브레인이 민달리를 공개하기 하루 전인 14일 초거대 멀티모달 AI '엑사원(EXAONE)'을 공개했다. 세계 최대 수준인 말뭉치 6000억 개와 이미지 2억 5000만 장 이상을 학습한 결과물이라고 소개했다. 1400만장 텍스트와 이미지 세트 데이터를 기반으로 개발된 민달리보다 큰 규모다.

 

민달리와 엑사원의 큰 차이점은 명령 수행 방식에 있다. 민달리는 텍스트 명령어에 따라 이미지를 만들 수 있지만, 그 반대의 역할은 하지 못한다. 이미지 입력값에 대한 텍스트는 만들 수 없는 것. 반면, LG 엑사원은 이미지-텍스트 양방향 생성이 가능하다.

 

김일두 대표는 "생성모델과 유사한 데이터를 가지고 이미지와 텍스트를 동시에 이해할 수 있는 AI 모델들도 많이 등장하고 있다"며 "AI가 세상을 이해하는데 있어서 시각적 정보와 텍스트 정보가 결합되는 시도들이 앞으로 더 발전할 것으로 보인다"고 말했다.

 

AI타임스 김동원 기자 goodtuna@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

김일두 카카오브레인 대표 "세계 최대 규모 AI 멀티모달 모델 곧 공개할 것" - AI타임스

김일두 카카오브레인 대표가 세계 최대 규모 멀티모달(multi-modality) 공개를 예고했다. 초거대 AI 멀티모달 \'민달리(minDALL-E)\'를 글로벌 오픈소스 커뮤니티인 깃허브에 공개했다고 밝힌 지 이틀 만

www.aitimes.com