AI테크

AI 영어선생님부터 코디, 로봇까지...ETRI가 개발한 AI 핵심기술들

AI타임스 2021. 10. 8. 15:53

ETRI, 7일 '2021 인공지능연구소 테크데이' 개최...연구성과 발표·시연
상용화 빠른 음성대화 기술, 말하기 학습 도와 교육부·문체부에 도입
사용자 중심 GAN부터 돌발상황대비 AI 패션 코디, 고령자 특화 로봇까지

 

(사진=ETRI)

한국전자통신연구원(ETRI) 인공지능연구소의 핵심 기술을 한 번에 둘러볼 수 있는 자리가 마련됐다. ETRI는 '2021 인공지능연구소 테크데이'를 7일 코엑스와 온라인에서 개최했다.

 

지난 2019년 설립된 ETRI 인공지능연구소는 국가 지능화 종합 연구기관으로서 역할을 수행 중이다.

 

이번 행사에서는 연구를 지휘하는 책임연구원들이 직접 인공지능(AI) 관련 연구성과와 기술개발 동향을 소개했다. 세미나를 통해 연구개발 중인 AI 관련 9개 분야 핵심기술을 발표하고, 전시룸을 열어 17개 기술을 시연했다.

 

ETRI가 올해 테크데이에서 강조한 9개 핵심기술은 ▲목적지향형 종단형 대화처리 ▲자율성장 AI-휴먼이해 인지컴퓨팅 ▲비디오 행동이해 ▲AI 반도체를 위한 시스템SW기술 ▲AI 반도체 기반 AI 서버, 아트브레인 케이(ArtBrain-K) ▲초저전력 리스크 파이브(RISC-V) 엣지 반도체(SoC) 기술 ▲휴먼케어 로봇을 위한 고령자 일상행동 인식 기술 ▲드론 시뮬레이션 및 사이버물리시스템(CPS) 기술 ▲PON 합의 이더리움 기반 의약품 유통플랫폼 기술이다.

 

ETRI가 개발한 AI 반도체 기반 AI 서버 아트브레인 케이 모습(사진=박성은 기자)

◆교육계 확산 빠른 음성대화 기술...준지도학습으로 필요 데이터·인력 줄여

 

실생활에 가장 빠르게 도입 중인 기술은 사용자가 음성으로 AI와 대화할 수 있게 하는 음성대화처리 기술이었다.

 

교육부가 전국 초등학교에 제공 중인 AI 기반 영어말하기 학습 서비스, 문체부가 외국인 대상 한국어 교육에 활용 중인 AI 기반 한국어 학습지원 시스템은 모두 ETRI가 개발한 음성대화처리 기술이 기반이다.

 

교육부가 올해 3월부터 전국 초등학교에 보급 중인 AI 영어 말하기 프로그램 펭톡 모습(사진=교육부)

 

비상교육과도 협약을 맺어 향후 비상교육 클라스 교육 시스템을 통해 동남아에 있는 한국인 발화를 수집 후 기술에 반영할 계획이다.

 

해당 기술을 개발한 ETRI 언어지능연구실은 현재 준지도학습형 음성대화처리 기술에 매진하고 있다. 준지도학습 방식을 사용하면 기존 지도학습형 기술보다 필요한 데이터와 인력이 줄어든다.

 

대화처리기술 개발에 필요한 학습 코퍼스를 충분히 확보하기 위한 기술도 개발 중이다.

 

권오욱 책임연구원은 "대화처리 기술 개발에는 학습 코퍼스가 중요한데 두 사람 간 대화 코퍼스는 현재 거의 없는 상황이다. 콜센터 정보 같은 것은 개인정보 문제로 활용할 수 없다. 우리는 시스템 간 대화로 다양한 대화를 늘릴 수 있는 기술을 개발하고 있다"고 말했다.

 

향후 연구 방향은 목적지향형 종단형 대화 모델에 텍스트 기반 모델을 추가하는 것이다. 목적지향이란 범위가 넓은 일상 대화가 아닌 영어 교육, 은행 상담과 같은 특정 목적에 한정된 것을 뜻한다. 텍스트를 추가한다는 의미는 AI가 사용자와의 대화에 쓰는 분야 데이터베이스(DB) 이외 관련 문서 자료를 활용하는 것을 뜻한다.

 

권 연구원은 "예를 들어 호텔 추천 시스템에서 호텔별 FAQ 데이터를 활용해 사용자 질문에 대답할 수 있다. 해당 연구를 작년부터 시작했다"고 말했다.

 

텍스트 이외 이미지 데이터를 사용하는 방법도 연구할 계획이다. 권오욱 연구원은 "엄마가 아이에게 그림책으로 언어를 가르치는 방식을 기술에 녹일 수 있을 것"이라고 전했다.
 

◆사람 이외 쓰레기도 인식하는 시각 AI...사용자 맞춤 GAN도 연구

 

ETRI의 시각지능 기술은 시각지능연구실에서 개발한 딥뷰가 대표적이다. 딥뷰는 대규모 이미지와 동영상에서 사람과 사물을 인식하고 사람의 행동을 분석해 실시간으로 영상의 내용을 이해하고 상황을 예측하는 기술이다.

 

딥뷰 활용 예시로는 AI 기반 쓰레기 무단투기 행위 금지 기술이 대표적이다. 전체적인 움직임 정보 이외 세부 관절 정보를 함께 활용하는 점, 사람 이외 물체를 함께 탐지하는 점이 특징이다. 해당 기술은 2019년 11월 유클리드소프트에 이전됐다.

 

딥뷰가 사람 움직임과 관절을 인식하는 모습(사진=박성은 기자)

최근 시간 분야에서 가장 주목받고 있는 주제인 GAN도 연구 중이다. ETRI가 개발 중인 GAN 기술은 사용자가 원하는 대로 세부적인 영상 부분을 쉽게 복원할 수 있다는 것이 특징이다.

 

사진을 프로그램에 불러 그림판에 연필을 그리듯이 선을 몇 개 그으면 사용자 의도를 읽어 자연스럽게 해당 부분을 수정해준다.

 

ETRI가 개발한 사용자 중심 GAN 기술. 터치 인식이 가능한 태블릿으로 이마 부분에 선을 그리니 머리카락이 추가됐다(사진=박성은 기자)

 

배유석 책임연구원은 “기존 GAN 기술은 형식이 제한적이라는 한계가 있다. 사용자가 원하는 대로 세부 사항을 변경하는 것이 아니라 일괄적인 형식으로 바꾼다. 우리 기술은 사용자에 맞춰 복원할 수 있다는 것이 특징”이라고 강조했다.

 

영상 데이터를 대상으로 하는 다른 주제로는 비디오 행동이해가 있다. 특히 예지형 시각지능 과제가 대표적이다.

 

해당 과제는 기존에 단순 인식 위주로 작동하는 시각지능 기술 한계를 극복하기 위해 사람 기억 매커니즘을 모사한 장기 시각 메모리 네트워크를 활용한다. 영상 정보를 체계적으로 기억함으로써 통합 이해와 미래 예측까지 가능하도록 구현하는 것이 목표다.

 

연구팀은 현재 이 기술을 활용해 고화질 영상에서 이미지를 상세 인식하는 방법을 연구 중이다.

 

스마트폰과 같은 개인 휴대 단말에서 생성되는 영상들은 품질과 해상도가 계속 높아지는 반면, 딥러닝 기반 비디오 이해 기술에서 처리 가능한 해상도는 현저하게 떨어지기에 필요한 기술이다.

 

문진영 책임연구원은 “얼굴이나 번호판 인식과 같이 상세 인식이 필요한 경우가 있다. 최근 개인 휴대 단말은 물론이고 지자체 CCTV들도 HD, 풀HD, 2K로 변화하고 있다. 그러나 딥러닝 기반 비디오 이해 기술에서 처리할 수 있는 비디오 해상도는 240p, 320p 정도”라고 설명했다.

 

이어 “페이스북이 올해 ICML에서 발표한 타임스포머(TimeSformer)도 일반 모델이 240p, 고해상도 모델이 480p 정도 해상도를 처리할 수 있다. 갭이 상당한 것”이라고 강조했다.
 

◆인간 학습 방식 모방하는 자율성장 AI, 복합데이터 스스로 학습

 

차세대 AI 기술에 가장 가까운 주제는 복합지능연구실에서 연구 중인 '자율성장 AI-휴먼이해 인지컴퓨팅'이었다. 사람과 같이 다양한 형태 지식을 스스로 습득하고 감정과 행동까지 이해하는 기술을 뜻한다.

 

연구실에서는 먼저 자율성장 에이전트와 휴먼이해 에이전트 2가지 기술을 각기 개발 중이다. 자율성장 에이전트는 사람 지식 습득 과정을 모방해 영상, 음성, 텍스트, 생체정보 등 멀티모달 데이터를 학습한다. 휴먼이해 에이전트는 라이프로그 데이터를 수집해 인간 감정과 행동을 이해하고 학습한다.

 

송화전 책임연구원은 “사람이 지식을 습득하는 과정을 보면 먼저 선험적 지식 습득 방식인 암기로 시작한다. 이후 추론을 하며 절차적 지식을 생성한다. 이 지식들이 소멸과 성장을 반복하면서 뇌 속 기억으로 자리잡는다”며 자율성장 에이전트가 모방할 지식 습득 방식을 설명했다.

 

즉, 인간 기억모델에 기반해 문제 해결을 위한 절차지식을 습득하고 사용자와의 상호작용을 통해 지식을 늘려나가는 것.

 

해당 기술을 접목한 서비스로 작년 10월 처음 공개한 것이 ‘패션하우’다. AI 기반 패션 코디 추천 서비스인 패션하우는 언어, 영상, 텍스트 등 패션 코디에 대한 다양한 형태의 복합지식을 학습한다. 사용자 질문 내용이 모호할 경우 스스로 답을 찾는 것이 특징이다.

 

패션하우 작동 모습. 메신저 형식으로 된 프로그램에 '내일 페스티벌에 갈 건데 뭐 입지?'라는 식으로 물으면 AI가 TPO에 맞는 코디를 제시한다(사진=박성은 기자)

 

[관련기사]ETRI, 사람과 대화해 스스로 학습하는 '자율성장 AI' 개발...패션 코디에 접목

 

송 연구원은 “의상 코디 데이터 종류는 신상이 매번 나오는 만큼 양이 어마어마하다. 여기에 자율성장 AI를 사용하면 TPO에 맞춰 의상 코디를 할 수 있다”고 말했다.
 

◆고령자 케어 AI 로봇, 리모컨도 찾아준다...세계 최초 고령자·로봇 특화 데이터셋 구축

 

ETRI에서 7일 최초 공개한 고령자 케어 AI 로봇도 전시장에서 직접 만나볼 수 있었다.

 

[관련기사]ETRI, 고령자 돕는 로봇 AI기술 발표...'수원에서 노인과 생활하며 검증'

 

ETRI가 공개한 고령자 케어 AI 로봇 모습(사진=박성은 기자)

고령자 케어 AI 로봇의 기본 기능은 헬스케어로 고령자의 일상 행동을 인식하는 것이다. 행동인식기술은 쓰러짐 여부를 인식해 응급 상황을 빠르게 파악하고 복약 여부를 확인해 건강을 관리할 수 있게 돕는다.

 

이외 화장, 옷입기, TV 시청, 음식 섭취와 같은 일상 행동도 인식하는데 이는 평소와 다른 일상 패턴을 빠르게 파악해 응급 상황이 오기 전에 대처할 수 있게 한다.

 

고령자를 모니터링하는 것 이외 가벼운 일상 대화는 물론 심부름도 가능하다. "헤이 제니, 리모컨 찾아줘"라고 로봇에게 말하면 직접 집 안을 돌아보며 리모컨을 찾고 돌아와 위치를 알려준다. 이외 정보 제공, 기억 지원, 운동을 코칭 등의 기능을 현재 탑재하고 있다.

 

이를 구현하기 위해 사용한 AI 기술은 ▲얼굴 특징 정보 인식 ▲얼굴 영상 심박 신호 추출 ▲의상 특징 정보 인식 ▲휴먼 일상 행동 인식 ▲휴먼 포즈 추정 ▲휴먼 동작 평가 ▲로봇 환경 물체 검출 ▲일상 소지품 인식 ▲물체 조작 ▲로봇 발화 제스처 생성 ▲상호작용 행위 생성 ▲모션 리타겟팅까지 총 12개에 이른다.

 

인간로봇상호작용연구실은 해당 로봇 개발을 위해 '고령자'와 '로봇'에 특화된 데이터를 직접 구축했다. 세계 최초 사례라 불리는 이유가 여기에서 나온다.

 

김도형 책임연구원은 “기존에 행동인식기술 관련해 공개 DB가 있지만 이는 고령자 케어 서비스에 활용하기에는 한계가 많았다”며 자체적으로 DB를 구축한 배경을 설명했다. 고령자는 일반 성인과 움직임이 다르며 로봇 시점을 반영해야 하기 때문.

 

연구팀은 독거 고령자 가정을 직접 방문해 여러 데이터셋을 구축했다. 이 중 리빙랩 데이터셋은 독거 고령자 거주 가구 50곳을 방문해 로봇으로 촬영한 세계 최초 3D 행동인식 데이터셋이다.

 

김 연구원은 “기존 DB는 실험실 환경에서 만들어졌지만 우리 DB는 로봇에 맞는 환경에서 고령자 대상으로 촬영한 대용량 DB다. 현재 전세계에서 ETRI만 제공하고 있으며 100여개 기관이 연구에 활용 중”이라고 말했다.

 

향후 연구팀은 청소, 식사 준비, 심부름 등 물리적으로 보다 적극적인 기능을 수행하는 방향으로 로봇을 개선할 예정이다.

 

김도형 연구원은 “현재 독거 가구나 노인 복지관에서 로봇을 운영하며 최적화 작업을 하고 있다. 앞으로는 정서, 인지 이외 물리 기능을 중점적으로 구축할 계획”이라고 말했다.

 

그는 “기존 로봇들은 안정적인 초기 지능을 기반으로 하는데 우리는 보다 확장된 지능을 목표로 한다. 다양한 환경 변화에 빠르게 적용하는 것이 로봇 기술의 우수성을 판가름한다”고 전했다.

 

고령자 케어 로봇에 사용하는 인간로봇상호작용연구실 기술은 도시규모 이동가이드 AI 기술, 실외 경비 로봇 기술 연구에도 활용될 예정이다.

 

AI타임스 박성은 기자 sage@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

AI 영어선생님부터 코디, 로봇까지...ETRI가 개발한 AI 핵심기술들 - AI타임스

한국전자통신연구원(ETRI) 인공지능연구소의 핵심 기술을 한 번에 둘러볼 수 있는 자리가 마련됐다. ETRI는 \'2021 인공지능연구소 테크데이\'를 7일 코엑스와 온라인에서 개최했다.지난 2019년 설립

www.aitimes.com