구글Ai 3

구글 AI, 대규모 다국어 음성-음성 번역 말뭉치 공개

21개 언어에서 영어로 음성-음성 번역 쌍으로 구성된 데이터 세트 ‘CVSS’ 공개 음성-텍스트 번역 단계 없이 직접 음성에서 음성으로 번역하는 시스템에 활용 190만 시간 분량의 표준 음성 버전(CVSS-C)과 원본 음성 버전(CVSS-T)을 제공 구글이 음성을 듣고 다른 언어의 음성으로 통역하기 위한 음성 대 음성 번역 말뭉치를 공개했다. 21개 언어에서 영어로 문장 수준의 음성-음성 번역(S2ST) 쌍으로 구성된 CVSS(Common Voice-based Speech-to-Speech Translation Corpus) 데이터 세트는 별도의 처리없이 직접 S2ST 모델을 훈련하는데 사용할 수 있다. 한 언어에서 다른 언어로 음성을 자동으로 번역하는 S2ST는 다른 언어를 사용하는 사람들 간의 의사 ..

AI테크 2022.04.06

"눈만 봐도 다 알아" 구글 연구진, 눈 이미지로 당뇨 진단 딥러닝 개발

눈동자 사진만으로 딥러닝이 당뇨 질환 예측 당뇨 망막질환·당뇨 수치가 높은지를 알아내 연구진 "기존 검사 방식보다 간단하고 저렴" 상용화되면 당뇨 검진 접근성 더 높아질 것 눈동자 이미지로 질병을 예측하는 딥러닝 기술이 나왔다. 특히 당뇨병 관련 만성 질환 증상을 눈 외부 사진 촬영만으로 알 수 있다. 기존 검사 방식보다 간단하고 저렴하다. 해당 기술이 상용화되면 당뇨 검진 접근성이 더 높아질 전망이다. 구글이 잠재적 당뇨 신호를 알려주는 딥러닝 모델을 24일 공식 블로그에서 소개했다. 기존 방식은 눈 내부까지 살펴보느라 높은 시간적·경제적 비용이 걸림돌이었다. 이번 소개한 기술은 눈 외부 이미지만으로 당뇨 질환을 간단하고 저렴하게 예측할 수 있다. 해당 모델, 어떻게 만들었나 모델 개발을 위해 구글 연..

AI테크 2022.03.29

인간 행동 모방하는 로봇 기술, '이 기술' 쓰면 정교화 '쑥' 올라

인간 행동 모방하는 로봇 개발 한창...모방 정교화 그리 높지 않아 구글 연구진, "명시적 모델을 암시적 모델로 바꾸면 더 정교해져" 암시적 BC, 명시적 BC가 가진 한계 보완 인간 행동 모방 로봇은 예전보다 자주 볼 수 있다. 국내에서는 제이엠로보틱스가 비전 기술로 인간 바리스타 라떼아트를 70초 만에 따라 하는 로봇을 출시했다. 영국 BBC는 맥주를 정량으로 따라 서빙하는 로봇을 15일(현지시각) 소개한 바 있다. 그러나 인간만큼 정교하게 하기엔 모자라다. 로봇 에이전트가 사람처럼 복잡한 행동을 똑같이 흉내내기엔 여전히 어렵다는 말이다. 예를 들어, 모방 도중 작은 변수가 생겼을 때 로봇은 계획 전체를 재빠르게 수정해 극복할 수 있어야 한다. 사람은 쉽게 바꿀 수 있지만 티끌 하나까지 계획에 맞춰 ..

AI테크 2021.11.23