생활 속 AI

[Aidea] ⑲ "AI가 청각장애인들의 '입'과 '귀' 된다"

AI타임스 2022. 3. 2. 10:10

스마트인재개발원 '꿈틀' 팀, 청각장애인 위한 번역 서비스 제안
딥러닝 기반 음성 분석 통해 실시간으로 개인 맞춤형 번역 제공
사용할수록 정확도↑…비장애인과 원활한 쌍방향 의사소통 도와
"당연하게 여겨지는 일상적인 일들 청각장애인들도 누릴 수 있길"

 

최근 열린 스마트인재개발원 최종 성과물 발표회에서 '꿈틀' 팀은 '청각장애인을 위한 음성 분석 기반 개인 맞춤형 번역 서비스'를 제안했다. (사진=셔터스톡).  

【편집자주】 광주광역시 소재 스마트인재개발원은 4차 산업혁명 시대에 발맞춰 양질의 IT 전문인력을 양성하면서 '인공지능 중심도시' 광주의 AI 생태계 조성에 힘을 보태고 있다. 그동안 스마트인재개발원 교육생들은 국내 주요 해커톤 대회에서 잇따라 우승해 실력을 입증해왔다. 최근엔 인공지능‧빅데이터 분야 과정을 수료한 청년들이 최종 프로젝트 성과를 발표했다. Aidea 기획시리즈를 통해 이들의 기발한 아이디어들을 소개한다.
# 중증 청각언어장애인 A씨. 일상생활에서 비장애인과의 의사소통에 어려움을 겪어오면서 답답하고 울컥할 때가 많았다. 그런데 최근 청각장애인을 위한 인공지능(AI) 기반 개인 맞춤형 번역 서비스가 나왔다는 소식을 접했다. 반가운 마음에 A씨는 곧바로 해당 서비스에 회원가입을 한 후 로그인을 했다.

평소 많이 쓰는 단어와 예시 문장으로 개인별 발음 학습을 할 수 있는 화면이 나왔다. 학습 화면 하단의 마이크 모양을 누르고 화면에 나타난 단어를 읽으면 A씨의 음성으로 단어가 학습된다. 원하는 단어를 추가해 학습시킬 수도 있다. 단어 페이지에서는 A씨가 학습 완료시킨 단어와 추가적으로 학습시키고 싶은 단어 리스트를 볼 수 있다. 

대화하기 화면에서는 다른 사람과 대화할 때 상대방 말이 실시간으로 표시된다. 학습된 A씨의 음성을 인식한 앱은 A씨가 하는 말을 번역해준다. 또 스피커 모양을 클릭하면 번역된 내용을 말소리로 들려주기도 한다. AI 번역 서비스를 통해 전보다 훨씬 더 편안하게 비장애인과 대화할 수 있게 되면서 일상 속 즐거움도 더욱 늘어난 A씨다.  

 

"높은 곳보다 낮은 곳에서 더 많은 걸 볼 수 있을지도 몰라."

 

최근 열린 스마트인재개발원 최종 성과물 발표회에서 '꿈틀' 팀은 프로젝트 소개에 앞서 한 농아인의 음성을 들려줬다. 처음 들었을 때는 이해하기 어려웠던 말소리가 이후에 제공된 자막을 읽으며 듣자 훨씬 알아듣기 쉬웠다. 꿈틀 팀은 이처럼 농아인들의 소통을 도울 수 있는 개인 맞춤형 번역 서비스에 대한 아이디어를 내놨다.  

 

농아인은 통상 청각장애로 인해 언어 구사에 어려움을 겪는다. 꿈틀 팀은 현재 청각장애인을 위한 정책들이 시행되고 있으나 의사소통 지원에 있어서는 여전히 부족한 점이 많다고 설명했다. 이에 청각장애인의 쌍방향 의사소통을 위한 음성 분석 기반 개인 맞춤형 번역 서비스인 '데시벨(Decibel)'을 제안했다.  

 

스마트인재개발원 '꿈틀' 팀의 최한글 팀장이 팀에서 고안한 '청각장애인을 위한 음성 분석 기반 개인 맞춤형 번역 서비스' 아이디어에 대해 설명하고 있다. (사진=스마트인재개발원 인쌤TV 유튜브).

기존의 일반 음성인식 서비스에서는 농아인의 음성을 입력했을 때 아예 음성으로 인식하지 못해 오류가 나거나 잘못 인식해 엉뚱한 대답을 내놓는 경우가 많다. 꿈틀 팀은 이 같은 문제를 해결하고자 인공지능(AI)을 활용해 농아인의 음성 인식 정확도를 높이는 데 집중했다. 딥러닝을 기반으로 개인의 음성 자체를 분석해주기 때문에 맞춤형 번역 서비스가 가능할 뿐만 아니라 사용할수록 정확도가 점점 더 개선된다는 설명이다. 또 비장애인인 대화 상대방의 음성도 실시간으로 번역돼 원활한 쌍방향 의사소통을 도울 수 있다는 것도 강점이다. 

 

꿈틀 팀은 향후 서비스의 확장 가능성도 제시했다. 현재 사용되고 있는 텍스트 번역 응용 프로그램 인터페이스(API)와 접목해 다양한 언어로도 번역될 수 있다는 것이다. 아울러 현재는 웹 앱 형식이나 앞으로 보완작업을 거쳐 모바일로 구축된다면 청각장애인을 위한 여러 교육기관이나 재활센터 등에서도 광범위하게 활용될 수 있을 것으로 보인다. 최한글 팀장을 통해 해당 아이디어에 대한 이야기를 들어봤다.   

 

꿈틀 팀의 청각장애인을 위한 개인 맞춤형 번역 서비스 '데시벨' 소개 영상. (영상=스마트인재개발원 인쌤TV 유튜브).

 

【인터뷰】 '꿈틀' 팀의 최한글 팀장

최한글 팀장.

Q. 아이디어를 고안하게 된 계기가 궁금합니다.

 

 버스정류장에서 버스를 기다리고 있다가 우연히 옆에서 작게 "으..." "어..." 하는 소리를 들었다. 소리가 나는 곳을 봤더니 농아인분들이 수화 중에 자연스레 입에서 내는 소리였다. 그 당시에는 그런가보다 하고 지나쳤는데, 이후 그분들의 대화가 계속 머릿속에서 맴돌았다.

 

농아인분들이 겪는 소통의 어려움을 생각하며 보이지 않게 단절돼 있는 것을 이어주고 싶었다. '뭔가 도움이 될 수 없을까?'하는 마음에서 시작해 '청각장애인을 위한 개인 맞춤형 번역 서비스'를 고안하게 됐다.

 

Q. 아이디어에 대한 구체적인 설명 부탁드립니다.

 

 우리 프로젝트인 '데시벨'은 학습할 단어를 농아인이 읽게 화면에 띄워준다. 음성 파일은 적절한 파라미터 값으로 전처리해 MFCC 과정을 거친다. 벡터화가 된 소리의 특성은 모델에 저장하게 했다. 학습된 소리와 새로 들어온 음성과는 유클리드 거리 공식을 통해 최근접 단어가 선택되게 했다.

 

Q. 프로젝트를 수행하는 과정에서 어려움은 없었는지요.

 

 농아인의 소리 데이터 수집과 데이터 전처리를 하는 데 어려움을 겪었다. 알아들을 수 없는 수준의 '농아인 음성 데이터'를 수집하기 위해 장애학교와 센터 등 여러 곳에 연락하고 인터뷰 요청도 해봤다. 하지만 전부 개인정보 보호 때문에 어렵다는 응답을 받았다.

 

기적적으로 팀원 지인의 지인이 농아인이셔서 그분의 도움을 받아 진행할 수 있었다. 처음 그분의 가이드 음성을 받았을 때 다들 뛰고 난리가 났었다. 우리의 프로젝트가 진행될 수 있도록 도움을 주신 그분께 정말 감사드린다. 그리고 그분의 소리 데이터로 최대한 좋은 결과를 얻기 위해 팀원들이 정말 고생이 많았다.

 

Q. 이번 성과가 향후 어떻게 활용될 수 있을지요?

 

 궁극적으로는 여행을 가고, 물건을 사고, 배우고, 일상적 대화를 나누며 소통하는 일 등 우리가 당연하게 누리는 것들을 약 9만 명의 중증 청각장애인도 누릴 수 있길 바란다. 농아인의 소리에도 어떤 규칙이 있을 것이라고 생각한다. 그 음성 데이터가 쌓인다면 지금보다 훨씬 더 정확하고 쉽게 번역될 수 있을 것이다. 그렇게 음성 데이터가 모여 새로운 서비스의 발판이 될 수 있다고 본다. 물론 지금은 부족한 점이 많다. 하지만 차차 보완해 나가면서 정식 서비스로 출시하도록 노력하겠다.

 

Q. 향후 계획에 대해.

 

 지금은 취업해 있지만 올해 방통대 컴퓨터 과학과로 입학할 예정이다. 공부할수록 점점 더 부족한 게 느껴졌다. 회사와 학교를 병행하면서 기초부터 제대로 배워, 직장인으로서가 아닌 개발자로서 성장하고 싶다.

 

Q. 마지막으로 강조하고 싶은 한 말씀.

 

 우리 팀명은 꿈틀이들의 꿈이 모인 'DreamBox'라는 뜻이다. 각자의 '꿈·틀'을 잃지 않게 지금도 서로 의지하고 있는 우리 팀원들 그리고 이런 기회를 만들어주신 우리 갓태양 선생님과 개발원 선생님들 한 분 한 분 다 감사를 전해드리고 싶다.

 

스마트인재개발원 '꿈틀' 팀 단체사진. (사진=최한글 팀장 제공).

AI타임스 윤영주 기자 yyj0511@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

[Aidea] ⑲ "AI가 청각장애인들의 '입'과 '귀' 된다" - AI타임스

【편집자주】 광주광역시 소재 스마트인재개발원은 4차 산업혁명 시대에 발맞춰 양질의 IT 전문인력을 양성하면서 \'인공지능 중심도시\' 광주의 AI 생태계 조성에 힘을 보태고 있다. 그동안 스

www.aitimes.com