AI테크

구글, 제한된 데이터셋으로 새 임무 '척척'하는 로봇 연구 성과 발표

AI타임스 2022. 2. 8. 10:59

'BC-Z', 여러 자연어 모델·이미지로 명령 해석 가능
100개 업무 가능 데이터셋으로 24개 새 임무 성공
데이터셋, 연구진 개입해 오류 바로잡아 질적 우수
전문가들 "새 임무 해내는 로봇, 갈 길 멀지만 가능"

 

단 100개 작업만이 가능한 데이터셋으로 새로운 임무 약 24개까지 완수하는 데 성공한 로봇 인공 신경망을 구글 AI 블로그에 2일 소개됐다. (사진=셔터스톡)

제한된 데이터셋으로 훈련하지 않은 낯선 업무까지 해내는 로봇 인공 신경망 'BC-Z'가 2일 구글 공식 블로그에서 소개됐다. 다양한 언어해석 모델과 비디오를 통한 명령에 따르는 기능으로 이뤄졌다. 지금까지 단 100개 작업만 가능한 데이터셋을 응용해 새로운 임무 약 24개까지 완수하는 데 성공했다.

 

관련 전문가도 스스로 학습하고 새 업무를 해결하는 '러닝머신(LM, Leaning Machine)'이 필요하다고 강조한 바 있다. 이를 통해 '범용 지능 로봇 (A general-purpose intelligence)' 분야가 한층 더 발전할 전망이다.

 

구글 연구진은 “자연어 모델·이미지 인식이 로봇에 유연한 입력 인터페이스를 제공할 수 있는 놀라운 사례”라며 “이는 로봇 학습 시스템의 일반성을 높이고 사람이 로봇을 지휘할 수 있도록 하는 중요한 발전이다”고 봤다. (영상=Google AI blog)

BC-Z 시스템은 두 가지 핵심 요소로 이뤄졌다. 100가지 작업을 수행할 수 있는 데이터셋과 언어 모델·비디오에 따라 반응하는 신경망이다.

 

연구진은 가상현실 헤드셋으로 로봇을 원격 조작해 100가지 업무가 가능한 데이터를 수집했다. 연구진은 로봇이 업무를 학습하면서 실수할 경우, 작업자가 개입해 수정하고 다시 가르쳤다. 지속적으로 오류를 수정함으로써 해당 시스템은 100가지 업무를 완벽히 학습했다. 

 

해당 방식은 단순히 데이터만 집어넣을 때보다 성능이 2배 올랐다. 데이터가 많지 않아도 인간이 직접 개입해 오류를 수정·시연하는 게 수십억 개 데이터를 가진 시스템보다 효과적이라는 의미다. 즉 양이 많은 데이터보다 질 높은 데이터가 성능이 뛰어났다.

 

연구진은 해당 데이터셋으로 신경망 정책(a neural network policy)를 훈련했다. 제한된 데이터를 통해 전혀 훈련하지 않은 업무를 수행하도록 시험하는 과정이다. 새로운 과제를 줄 때는 언어 명령과  그 과제를 수행하는 과정을 비디오 형식으로 입력했다.

 

예를 들어 '빨간 그릇에 포도 담기'는 로봇 신경망에겐 낯선 임무다. 훈련 중에는 '포도'와 '빨간색' 그릇이 등장한 적이 없어서다. 연구진은 “빨간 그릇에 포도를 담아라”고 언어 명령을 내린다. 또 빨간 그릇에 포도를 담는 장면을 비디오로 찍어서 로봇에 보여준다. 로봇은 기존 데이터를 가지고 언어와 이미지를 해석해 새 업무를 수행한다. 

 

훈련한 적 없는 임무 수행에 성공한 로봇. (영상=Google AI blog)

연구진은 전혀 훈련한 적 없는 28개 과제를 테스트한 결과, 약 24개에서 뚜렷한 성과를 확인했다. 로봇이 훈련 데이터에 없는 임무를 성공적으로 수행할 수 있다는 긍정적 성과다.

 

연구진은 “자연어 모델·이미지 인식이 로봇에 유연한 입력 인터페이스를 제공할 수 있는 놀라운 사례”라며 “이는 로봇 학습 시스템의 일반성을 높이고 사람이 로봇을 지휘할 수 있도록 하는 중요한 발전이다”고 봤다. 

 

전문가, "인간 도움 없이 학습하는 로봇? 갈 길 멀지만 가능해"


관련 전문가도 인공지능(AI)이 사람 뇌처럼 스스로 학습하고 기능할 수 있는지에 긍정적 입장을 내비친 바 있다. 다시 말해, 사람이 입력한 데이터셋을 통해서만 작동하는 머신러닝(ML)을 뛰어넘을 수 있다고 주장했다. 아직 갈 길은 멀지만, 기존 데이터를 통해 스스로 학습하고 새 임무를 해결할 수 있는 LM가 나올 수 있다고 내다봤다.

 

장병탁 서울대 교수가 인공지능 발전 단계를 설명하며 ML에서 LM로 가기 위한 기술적 과제에 대해 언급했다. (사진=글로벌인공지능포럼 캡처, 편집=김미정 기자)

작년 열린 '글로벌 인공지능 포럼'에서 장병탁 서울대 컴퓨터공학 교수는 "현재 기술 단계는 AI가 스스로 데이터를 만들 수 없다"며 "다음 단계 도약을 위해선 여전히 갈 길이 멀지만 불가능 한 일은 아니다"고 설명했다. 그는 "머신러닝(ML)에서 LM로 가려면 데이터셋을 스스로 만들어 학습하고, 예상치 못한 변수에 능동적으로 대처까지 할 수 있어야 한다"고 강조했다.
레슬리 캘블링 MIT 교수가 점진적인 계획을 구체화해 목표 달성하는 '계층화 방식 구조'를 실행 중인 로봇을 소개하고 있다.  (사진=글로벌인공지능포럼 캡처, 편집=김미정 기자)

 

레슬리 캘블링(Leslie Pack Kaelbling) MIT 교수도 범용 지능 로봇을 소개하며 LM을 긍정적으로 봤다. 그는 "'계층화 방식 계획(Hierarchical planning in the now)' 을 통해 가능하다"고 설명했다. 계층화 방식 계획이란, 최종 목표하나를 설정하면 계획을 처음엔 추상적으로 세우지만, 점진적으로 구체화해 목표에 달성하는 방식이다. 해당 과정을 통해 “로봇도 인간이 하는 추론 메커니즘을 형성할 수 있다”고 말했다.

다시 말해, 로봇에 복잡한 명령을 주입하면, 그래프 신경망을 활용해 새로운 환경이나 사물을 인식한다. 이를 통해 계층화 방식으로 '범용 플래너(추상적인 계획에서 구체적인 계획으로 차근차근 목표치에 다가감)' 를 스스로 만든다. 해당 원리는 작은 단위(기능)를 모아서 복잡한 시스템(최종 목표)에 점진적으로 다가가는 방식이다. 기본 알고리즘을 갖춘 로봇이 정보를 스스로 모아 최대한 성능을 키울 수 있다는 것이다. 

AI타임스 김미정 기자 kimj7521@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

구글, 제한된 데이터셋으로 새 임무 '척척'하는 로봇 연구 성과 발표 - AI타임스

제한된 데이터셋으로 훈련하지 않은 낯선 업무까지 해내는 로봇 인공 신경망 \'BC-Z\'가 2일 구글 공식 블로그에서 소개됐다. 다양한 언어해석 모델과 비디오를 통한 명령에 따르는 기능으로 이뤄

www.aitimes.com