데이터세트 2

“데이터 부족 걱정마”…AI 기반 자동 레이블링 시스템 출시

레이블(lable)이 지정된 데이터 세트를 자동으로 생성 광범위한 컴퓨터 비전 분야의 레이블링 작업에 활용 마이크로 모델링 기반의 능동적 학습 프로세스 적용 의료 이미지 분석을 위해 레이블(lable)이 지정된 데이터 세트를 자동으로 생성하는 AI 시스템이 출시됐다. 의료 영상, 자율 차량, 농업, 및 위성 영상 등 광범위한 컴퓨터 비전 분야의 레이블링 작업에 활용될 전망이다. IT전문매체인 테크크런치(TechCrunch)에 따르면 미국의 스타트업 인코드(Encord)가 컴퓨터 비전 프로젝트를 위한 레이블이 지정된 데이터 세트를 생성하는 AI 기반 레이블링 시스템 ‘코드비전(CodeVision)’을 출시했다. 레이블이 지정된 데이터 세트는 알고리즘이 학습할 수 있는 ‘근거’를 제공하기 때문에 중요하다. ..

AI테크 2022.04.12

의료 AI 데이터 편향 심각하다…미국과 중국 데이터가 절반 이상 차지해

미국과 중국 비롯한 고소득 국가의 환자 데이터가 대부분 차지 편향된 환자 데이터를 AI가 사용할 때 결과적으로 위험을 초래 소수 부유한 국가에서 수행된 연구와 실험 결과로 임상 일반화 장기적인 데이터 수집과 국제 데이터 저장소 구축 필요성 제기 임상 AI에 사용되는 데이터 세트의 절반 이상이 미국이나 중국에서 온 것이라는 연구 결과가 나왔다. AI가 알고리즘을 훈련하고 검증한 결과는 데이터가 사용된 집단 이외의 집단에선 제대로 일반화되지 않는다는 점을 감안할 때 데이터가 풍부한 지역의 인구는 데이터가 부족한 지역에 비해 훨씬 더 많은 혜택을 누리게 되어 의료 격차를 심화시킬 수 있다. 국제학술지인 'PLoS 디지털 헬스(Digital Health)'에 게재된 논문을 보면 2019년에 발표된 7,000개 ..

포커스 2022.04.11