AI초대석

만 19세 청년, 가상현실로 AI 데이터 확보 문제 해결 방안 마련...김이삭 'K-Digital Training 해커톤' 대통령상 수상자 인터뷰

AI타임스 2021. 7. 29. 13:26
2021 디지털 신기술 실무인재양성(K-Digital Training) 해커톤에서 1위
가상현실에서 데이터 확보 문제 해결...산불·재난 데이터 확보도 가능
고교 졸업 후 대학 진학 않고 아이펠에서 AI 공부, 대전캠퍼스 1기 수료
"AI 공부하고 준비해 대학교 진학 후 창업하는 게 목표"

 

김이삭 'K-Digital Training 해커톤' 대통령상 수상자. (사진=김동원 기자)

인공지능(AI) 개발에 주요 장애물이던 데이터 확보 문제를 해결할 방안이 제시됐다. 데이터 확보가 어려운 산불, 재난 등 특수한 조건의 데이터를 가상환경에서 수집한다. 프로그램 사용방법도 간편해 AI 전문가가 아니더라도 누구나 쉽게 데이터를 수집할 수 있다. 그만큼 확보할 수 있는 데이터양이 급속도로 증가할 전망이다.

 

해당 프로그램은 고용노동부가 주관한 '2021 디지털 신기술 실무인재양성(K-Digital Training) 해커톤'에서 나왔다. 프로그램을 개발한 건 김이삭 학생(02년생)이 팀장으로 있는 모두의연구소 아이펠(AIFFEL)의 '심투데이터(Sim2Data)' 팀이다. 김이삭 팀장을 필두로 김상민(95년생), 문재윤(93년생), 심영준(92년생), 전다형(85년생) 등 5명이 한 팀으로 구성된 심투데이터 팀은 해당 프로그램 개발을 인정받아 29일 대통령상을 수상했다.

 

김이삭 팀장의 나이는 만 19세다. 어리다고 평가될 수 있는 나이에 AI 업계가 고민하는 데이터 확보 문제에 하나의 해답을 제시했다. 고등학교를 졸업한 그는 대학을 바로 진학하지 않고 아이펠에서 AI 관련 공부를 하며 이번 성과를 냈다. 아이펠은 모두의연구소가 설립한 AI 혁신학교다.

 

"데이터 부족 문제는 AI 초기 개발과정에서 커다란 장애물이에요. 산불이나 건물 붕괴 등 특수한 환경은 현실적으로 데이터를 만들기가 어려워요. 이 문제를 극복하고 데이터 활용 과정에서 발생하는 문제점들을 보완하고자 프로그램을 개발했어요."

 

아이펠 대전캠퍼스에서 만난 김이삭 팀장은 밝은 표정으로 프로그램 필요성을 명확히 설명했다. 이 프로그램의 장점을 한마디로 정리하면 가상환경 데이터셋을 활용해 저비용·고효율의 데이터 구축을 실현시킬 수 있다는 것이다.

 

AI는 시장 성장과 함께 데이터 시장도 빠르게 확장됐지만, 데이터 구축에 필요한 데이터 확보와 정제, 가공, 검수, 검증 등에 많은 시간과 비용이 소모되는 단점이 있었다. 일례로, 자율주행차 관련 AI 연구를 하고자 하면 차를 타고 다니며 도로 정보와 주변 환경 등의 데이터를 하나씩 다 모아야 한다. 상당한 시간이 걸린다. 또 모은 데이터를 가공하고 검수하는 과정까지 합치면 소요되는 시간은 배로 늘어난다.

 

김이삭 팀장과 팀원들은 이 시간을 줄이고자 누구나 쉽게 가상환경에서 데이터를 수집할 수 있는 기술을 구현했다. 가상환경에서 날씨와 배경을 바꿔가며 데이터를 수집할 수 있다. 자동차, 드론 등 촬영 주체를 임의로 선택하는 것도 가능하다. 김 팀장은 이 프로그램을 계속 발전시켜 나가 산불, 재난 등 데이터 확보가 어려운 분야의 데이터를 수집할 수 있는 방안을 마련한다는 계획이다.

김이삭 팀장은 이번 수상은 AI 혁신학교 아이펠에서 만난 우수한 팀원들의 영향이라고 밝혔다. (사진=김동원 기자)

Q. 대통령상 수상 축하한다. 이번 프로그램을 개발한 계기가 궁금하다.

 

모두의연구소에서 운영하는 아이펠 대전캠퍼스에서 1기로 교육을 받은 후 이대로 마치기 아쉬워서 마음이 맞는 사람들과 해커톤에 나가자고 했다. 팀원 분 중에 시뮬레이션 분야를 전문으로 연구하시는 분이 계시는데 그 분이 아이디어를 주셨다.

 

Q. 이번 프로그램이 상용화되면 어떤 긍정 효과가 있다고 보는가.

 

AI에 가장 큰 문제는 데이터셋 만들기다. 자율주행차 관련 AI를 개발한다고 하면 데이터 확보에 20억원 이상이 필요한 대규모 프로젝트가 필요하다. 우리가 만든 프로그램은 합성 데이터셋이라는 한계가 있지만, 이 부담을 줄여줄 수 있다. 실제로 데이터셋을 2만 장 모으려고 했을 때 1시간이면 가능했다.

 

Q. 합성 데이터셋이 가진 한계는 어떤 건가.

 

아무래도 임의로 만든 데이터다 보니 깔끔한 부분이 있다. 노이즈 등이 없고 너무 깔끔하다 보니 학습이 잘 안 되는 부분이 있다. 이 한계를 극복하기 위해서 가상 데이터의 정확도를 높이는 연구가 필요하다. 실제로 실험해본 결과 가상 데이터셋 2만 장과 직접 촬영한 실제 데이터 5천 장을 비교했을 때 성능이 비슷했다.

 

Q. 이번 대통령상을 수상한 심투데이터 팀의 팀원에 대해 소개해 달라.

 

아이펠에서 자체적으로 3차 해커톤을 했는데 이 과제를 함께한 로봇 전공자와 함께 팀을 이뤄 대회에 출마했다. 또 아이펠에서 함께 공부한 컴퓨터공학과 학생도 합류했고, 비즈니스 모델과 사업화 등에 뛰어는 물리학 전공자도 함께 했다. 드림팀이라고 생각한다.

김이삭 팀장(오른쪽 끝)과 심투데이터 팀원, 아이펠 학생들의 모습. (사진=모두의연구소)

Q. 팀장이지만 가장 나이가 어려 놀랐다.

 

팀원들이 감사하게도 팀장으로 뽑아주셨다. 팀원들의 도움으로 우수한 성과를 냈다고 생각한다.

 

Q. 아이펠 대전캠퍼스 1기 수료자다. 아이펠에서의 교육이 도움이 됐나.

 

사실 아이펠에 오기 전까진 AI, 데이터, 시뮬레이션 등에 대해 잘 알지 못했다. 아이펠에서 기초적인 것을 배우고 프로젝트도 해서 많이 배울 수 있었다.

 

Q. 아이펠 교육의 장점은 무엇이었나.

 

아이펠은 선생님이 없는 학교다. 대신 필요한 수업 프로그램이 잘 갖춰져 있고 아이펠을 먼저 수료한 선배가 도와주는 체제가 있다. 또 공부하고자 하는 사람들이 모여서 함께 토론하고 논의하며 배울 수 있는 장점이 있다. 전부 뚜렷하고 공통된 목표가 있다 보니 시너지가 나는 것 같다. 선생님이 있으면 선생님만 보고 공부할 텐데 선생님이 없고 다양한 사람과 토론을 하며 수업을 하다 보니 더 많은 것을 배울 수 있어 좋았다.

 

Q. AI 시장이 커지면서 관련 교육을 전문으로 하는 아이펠 입학 경쟁률도 높아지고 있다. 입학할 수 있던 비결은 무엇이라고 보는가.

 

아이펠이 좋은 것이 학벌, 능력 등을 보지 않는다. 열정을 중심으로 봐주시는 것 같다. 실제로 면접을 볼 때 한 가지 대답밖에 못했다. 미리 질문지를 주고 대답을 준비해가는 것이었는데 너무 떨려서 많은 답을 못했다. 하지만 그 대답에서 AI 공부에 대한 열정을 봐주신 것 같다.

 

Q. 고등학교 졸업 후 대학에 진학하지 않고 아이펠에 갔다. 이유는 무엇인가.

 

대학에 가서 친구들과 창업을 하는 것이 목표다. 그러기 위해선 더 준비가 필요하다는 생각이 들었다. 모두의연구소에서 다양한 사람에게 많은 것을 배우고 AI 관련 지식도 넓힌 후 대학에 가는 것이 좋다고 생각했다.

 

Q. 부모님의 반대는 없었나.

 

부모님이 개방적이다. 오히려 제가 잘하는 분야를 찾아 그 길을 가길 원하신다. 믿어주셔서 감사하다.

 

Q. 학생 때부터 이 분야에 관심이 많았나.

 

AI나 데이터 등에 대해서는 몰랐지만, 확실히 수능 공부 항목보다는 컴퓨터 분야에 관심이 많았다. 중학교 때는 게임을 만들고 싶어서 도서관에 책을 빌려 간단한 게임을 만든 경험이 있다. 고등학교 때는 카이스트(KAIST)에서 창업한 웹 개발 회사에 인턴으로 근무한 경험도 있다. 이때 회사 대표로 미국에 출장을 가서 홈케어 서비스 관련 문의를 하기도 했다.

 

Q. 앞으로 계획이 궁금하다.

 

창업을 하는 것이 단기적인 목표다. 실패할 수도 있지만 시도해보는 것이 첫 번째 목표다. 분야는 아직 확실하지 않지만, 메타버스 쪽을 생각하고 있다. 추후에는 AI와 주식을 합친 솔루션을 선보이고 싶다. 이 분야는 아직 제대로 공부하지 않았지만, 어렸을 때부터 주식에 관심이 많았던 만큼 이 분야에서 성과를 내고 싶다.

 

AI타임스 김동원 기자 goodtuna@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

만 19세 청년, 가상현실로 AI 데이터 확보 문제 해결 방안 마련...김이삭 'K-Digital Training 해커톤' 대

인공지능(AI) 개발에 주요 장애물이던 데이터 확보 문제를 해결할 방안이 제시됐다. 데이터 확보가 어려운 산불, 재난 등 특수한 조건의 데이터를 가상환경에서 수집한다. 프로그램 사용방법도

www.aitimes.com