AI 활용해 사람의 미묘한 감정을 음성으로 구현
웃음과 숨소리 등 언어가 아닌 음성을 만들어내
사용자가 직접 조정할 수 있는 음성 합성을 실현
비디오 게임, 엔터테인먼트, 가상현실 등에 유용
인공지능(AI) 음성 합성의 선두주자인 소넌틱(Sonantic)이 발렌타인 데이를 기념하기 위해 “그녀의 비밀은 무엇입니까?(What’s Her Secret?)”라는 제목의 비디오를 게시 했다. 영상에 등장하는 여성은 실존 인물이지만 말을 하는 주인공은 인공지능(AI)이라는 사실이 밝혀져 시청자들을 놀라게 했다. 이 비디오는 AI를 활용하여 사람의 미묘한 감정을 음성에 담아 내는 획기적인 기술을 보여준다.
기술매체 더버지(The Verge)에 따르면 소넌틱은 신경망 모델을 이용해 사람의 미묘한 감정을 표현하는 음성 합성 기술을 공개하기 위해 비디오를 만들어 배포했다. 영상은 한 여성이 사랑 고백을 하는 내용이지만 마지막 부분에서 화면의 여성은 실제 인간이지만 전체 음성은 AI가 만든 것이었음을 보여준다. 이 새로운 음성 모델은 행복과 슬픔의 감정을 넘어 수줍음, 놀림, 유혹 과 같은 미묘한 뉘앙스를 담은 목소리를 표현할 수 있다. 또한 숨소리, 콧방귀, 웃음과 같은 비언어적 음성을 구현하는 기능도 탑재했다.
소넌틱의 CEO인 지나 쿠레시(Zeena Qureshi)는 자사의 AI 음성 합성 기술이 다양한 감정을 모방할 수 있는 ‘음성용 포토샵’이라고 설명했다. 인터페이스를 통해 사용자는 합성하려는 말을 입력하고 전달할 분위기(감정)를 지정한 다음 실제 인간 배우의 목소리를 복사한 AI 목소리를 선택할 수 있다. 분노, 두려움, 슬픔, 행복, 기쁨와 같은 감정을 선택할 수 있고, 시시덕거림, 수줍음, 놀림 및 자랑 등의 감정이 추가적으로 포함된다. 목소리의 높낮이를 조정할 수 있고 전달 강도를 높이거나 낮출 수 있으며 웃음과 숨소리 등 언어가 아닌 소리를 삽입할 수 있다.
공동 창립자인 존 플린(John Flynn)은 다른 회사들이 단순히 사람의 음성을 모방하는 AI 합성 음성을 추구하고 있지만, 소넌틱의 기술은 사람의 미묘한 감정 표현과 사용자가 직접 조정이 가능한 음성 합성을 실현했다고 주장했다. 이어 "나는 이것이 주요 차이점이라고 생각한다. 공연을 지휘하고 제어하고 편집하고 조각하는 건 우리의 능력이다"라고 말했다.
소넌틱의 AI 음성 합성 기술은 비디오 게임과 엔터테인먼트에 주로 사용되었지만 최근에는 다른 산업으로 용도가 확대되고 있다. 비디오에 구현된 미묘한 감정은 급성장하는 가상 인간의 가상 현실 무대에서도 유용할 수 있다.
AI타임스 박찬 위원 cpark@aitimes.com
Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지
사랑을 속삭이는 그녀의 비밀은?...AI 성우 - AI타임스
소넌틱(Sonantic)이 발렌타인 데이를 기념하기 위해 “그녀의 비밀은 무엇입니까?”라는 제목의 비디오를 게시 했다.(영상=소넌틱)인공지능(AI) 음성 합성의 선두주자인 소넌틱(Sonantic)이 발렌타인
www.aitimes.com
'AI테크' 카테고리의 다른 글
메타버스로 느껴보는 1919년 3월 1일의 서대문형무소 (0) | 2022.02.28 |
---|---|
카이스트·고려대, 배터리 수명 늘리고 안정성 높이는 연구 발표 (0) | 2022.02.23 |
양자 컴퓨터도 해독 못해…안면 인식을 위한 암호화 기술 개발 (0) | 2022.02.22 |
인공지능이 코로나19 진단·치료 돕는다...국내외 연구·개발 성과는 (0) | 2022.02.22 |
마취의학과 AI의 만남...정량적 마취, 정확한 신경차단, 부작용 없애 (0) | 2022.02.21 |