AI산업

데이터 시장의 그림자 "공공데이터 불법으로 파는 '해적' 생길 수 있다"

AI타임스 2022. 4. 28. 11:29

AI 발전으로 급격히 성장한 언어 데이터 시장
데이터 판매 기업 우후죽순 증가, 규칙은 없어
저작권 침해·데이터 불법 판매 발생 소지 있어
"온전하게 데이터 수집하는 규칙·기술 정착돼야"

 

데이터 시장이 급격히 커진 데 반해 명확한 규칙과 장치가 없어 여러 문제가 발생하고 있는 것으로 나타났다. (사진=셔터스톡)

최근 급격하게 성장한 언어 데이터 시장에 명확한 규칙이 있어야 한다는 주장이 제기됐다. 데이터에 대한 이해가 없는 기업이 우후죽순 시장에 뛰어들면서 저작권 침해 등 문제가 양산되고 있는 것으로 나타났다. 지금은 공공데이터를 해외에 불법으로 팔아도 이상할 것 없는 상황이라는 지적도 나왔다.

 

이정수 플리토 대표는 지능정보산업협회(AIIA)와 지능정보기술포럼(TTA ICT 표준화포럼 사업)이  이달 공동 주최한 조찬 포럼에서 현재 데이터 시장의 문제점을 지적했다. 그는 "현재 언어 데이터 시장은 명확한 규칙이 없는 상황"이라며 "인공지능(AI) 발전으로 데이터 시장은 급격하게 커지고 있고 시장에 있어야 할 규칙과 제도는 없어 여러 가지 문제가 발생하고 있다"고 염려했다.

 

대표되는 문제점 중 하나는 저작권이다. 최근 '데이터가 돈이 된다'는 인식이 강해지면서 많은 업체가 데이터 시장에 뛰어들고 있다. 이 대표에 따르면 이 업체들 가운데 기존부터 데이터를 전문으로 하고 있던 업체는 적다. 전문 번역 회사처럼 다른 업종을 하다 데이터 판매 사업에 뛰어든 업체가 다수다.

 

번역 회사의 경우 보유하고 있는 데이터의 저작권이 불분명한 경우가 많다. 예를 들어 해외 유명 소설을 한글로 번역한 문장이 번역 회사 저작권이 될 수는 없다. 하지만 이 번역 회사의 경우 영어로 된 언어 데이터, 번역한 한글 데이터를 모두 보유하게 된다. 이 데이터를 판매하게 된다면 저작권 없는 상품을 팔 수 있는 것이다.

 

이 대표는 "회사 입장에서는 당연히 고민이 될 것"이라며 "마진율이 100%이기 때문"이라고 말했다. 이어 "번역 회사는 이미 해당 사업을 하며 생성된 데이터고 학습한 다음에 증거가 남지 않으니 그 유혹은 더 클 수 있다"고 말했다.

 

이정수 플리토 대표는 "AI 발전으로 데이터 시장은 급격하게 커지고 있고 시장에 있어야 할 규칙과 제도는 없어 여러 가지 문제가 발생하고 있다"고 지적했다. (사진=김동원 기자)

그는 공공데이터를 해외에 판매하는 부작용도 발생할 수 있다고 보았다. AI 허브 등에 공개된 공공·민간데이터를 무단으로 다운로드 받아 다른 나라에 판매하는 업체가 생길 수 있다는 지적이다. 이 대표는 "공개된 데이터를 어둠의 경로로 받아 중국 등에 팔면 이 역시 마진율이 100%가 된다"며 "현재 데이터 시장에는 이를 통제할 정확한 규칙이 없어 이러한 일이 발생해도 이상할 것 없는 상황이다"라고 토로했다.

 

이 대표는 이 문제를 해결하기 위해선 시장에 올바른 규칙이 생겨야 하고 데이터를 정당하게 수집하는 전문 기업이 많아져야 한다고 주장했다. 특히 자체 B2C(기업과 소비자간 거래) 플랫폼을 활용해 스스로 온전한 데이터를 수집하는 문화가 정착돼야 한다고 조언했다.

 

그는 "최근 데이터에 저작권이 계속 강조되고 있다"며 "인터넷에 있는 데이터도 최초로 작성한 출처가 중요해졌다"고 말했다. 이어 "데이터 산업이 저작권 문제없이 발전하려면 스스로 데이터를 정당하게 수집할 수 있는 전문 데이터 기업이 많아져야 한다"고 덧붙였다.

 

데이터를 수집하는 플랫폼도 기술 고도화가 이뤄져야 한다고 조언했다. 잘못된 데이터를 자체적으로 수정하는 AI 엔진 등을 개발해 플랫폼에 탑재할 필요가 있다고 말했다. 그는 "플랫폼 내에서 잘못된 데이터를 수정해 학습시키는 과정이 한 번에 이뤄지면 데이터 산업과 AI 산업이 빠르게 성장할 수 있을 것"이라며 "플리토는 이러한 플랫폼 제공에 앞장서고 있고 많은 기업과 협업할 의사가 있다"고 밝혔다.

 

AI타임스 김동원 기자 goodtuna@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

데이터 시장의 그림자 "공공데이터 불법으로 파는 '해적' 생길 수 있다" - AI타임스

최근 급격하게 성장한 언어 데이터 시장에 명확한 규칙이 있어야 한다는 주장이 제기됐다. 데이터에 대한 이해가 없는 기업이 우후죽순 시장에 뛰어들면서 저작권 침해 등 문제가 양산되고 있

www.aitimes.com