21개 언어에서 영어로 음성-음성 번역 쌍으로 구성된 데이터 세트 ‘CVSS’ 공개 음성-텍스트 번역 단계 없이 직접 음성에서 음성으로 번역하는 시스템에 활용 190만 시간 분량의 표준 음성 버전(CVSS-C)과 원본 음성 버전(CVSS-T)을 제공 구글이 음성을 듣고 다른 언어의 음성으로 통역하기 위한 음성 대 음성 번역 말뭉치를 공개했다. 21개 언어에서 영어로 문장 수준의 음성-음성 번역(S2ST) 쌍으로 구성된 CVSS(Common Voice-based Speech-to-Speech Translation Corpus) 데이터 세트는 별도의 처리없이 직접 S2ST 모델을 훈련하는데 사용할 수 있다. 한 언어에서 다른 언어로 음성을 자동으로 번역하는 S2ST는 다른 언어를 사용하는 사람들 간의 의사 ..