AI산업

AI로 자기소개서 분석한 결과 "절반 가까운 문서가 표절 의심"

AI타임스 2022. 4. 8. 14:12

AI 채용 플랫폼 '프리즘'이 123만 건 문서 분석 결과
문서 결함 39%·블라인드 위반 37%'·표절 의심 47%
프리즘, 사람이 확인 어려운 표절·결함 단시간에 확인
AI 관계자 "AI 100% 믿어선 안 돼, 사람의 확인 필요"

 

AI 채용 솔루션으로 지난해 123만 건의 자기소개서를 분석한 결과 47%의 문서가 표절률 30% 이상을 보인 것으로 밝혀졌다. (사진=셔터스톡)

취업에 사용된 자기소개서 중 절반 가량은 표절이 의심되는 것으로 나타났다. 자연어 기반 인공지능(AI) 기업 무하유는 자사 AI 채용 솔루션 '프리즘'으로 작년 한 해 123만 건의 자기소개서를 분석한 결과를 7일 공개했다. 이 중 47%의 자기소개서가 표절률 30% 이상을 보인 것으로 밝혀졌다.

 

프리즘은 자연어처리(NLP) 기반 AI 기술로 자기소개서의 문맥을 이해해 업무 적합도를 찾아주는 채용 플랫폼이다. 채용담당자가 확인하기 어려운 표절이나 오기재, 반복 기재, 블라인드 위반 요소 등을 검출할 수 있다. 사람이 자기소개서를 검토하는 시간이 평균 10분인데 반해 프리즘은 평균 8초 안에 문서를 확인한다.

 

현재 이 채용 플랫폼은 민간과 공공 기업 약 270개사가 사용하고 있다. 지난해에만 123만 건이 넘는 자기소개서를 검토했다. 채용 1회당 평균 3000건 내외의 문서를 검토하는 것으로 알려졌다.


프리즘 공급사인 무하유는 지난해 자기소개서를 분석한 결과 글자 수 미달·회사명 오기재 등의 '결함'이 있었던 문서는 39%, '블라인드 위반'을 한 문서는 37%였다고 밝혔다. 또 30% 이상을 표절한 자기소개서도 47%에 달했다고 소개했다.

 

프리즘이 지난해 123만 건의 자기소개서를 분석한 결과 '결함'이 있었던 문서는 39%, 블라인드 위반 문서는 37%, 표절 의심 문서는 47% 있었던 것으로 파악됐다. (사진=무하유)

자기소개서에서 '반복 단어', '반복 문항', '글자 수' 등의 결함은 1건만 적발돼도 탈락 처리하는 '중대결함'으로 꼽히는 요소다. 이번 분석 결과 123만 건의 자기소개서 중 글자 수 미달이 있었던 문서는 26%였다. 반복 문항 결함도 13% 나타났다. 회사명 오기재(13%), 타 기업 지원(11%) 등도 다수 발견됐다.

 

블라인드 평가에서는 지원자 이름, 성별, 가족 직업, 출신 대학교 등을 드러내 채용 위반을 저지른 지원자도 있었다. 이름을 노출한 경우가 40%로 가장 많았고 성별을 노출한 경우가 31%였다. 가족 직업을 작성하는 경우도 13%가 검출됐다. 대학 이름을 작성하는 경우는 0.9%로 비교적 적은 것으로 나타났다.

 

특히 군 복무 키워드는 지원자들도 미처 생각하지 못하고 쓰는 사례로 꼽혔다. 블라인드 채용 시 성별을 드러내면 안 되기 때문에 '전문 연구 요원', '병장', '병역 특례' 등의 키워드는 모두 프리즘에 의해 검출된다.

 

표절의 의심되는 문서도 많았다. 자기소개서는 글자 수가 많지 않고, 쓸 수 있는 표현이나 내용이 한정적이어서 논문이나 보고서(표절률 15~20% 이상일 때 위험)에 비해 기업의 경우 30~50% 수준으로 표절률 기준이 낮은 편이다. 그럼에도 불구하고 프리즘 데이터 123만 건 중 47%의 자기소개서가 표절률 30% 이상을 기록했다. 

 

신동호 무하유 대표는 "프리즘은 채용담당자가 확인하기 어려운 결함, 표절, 블라인드 요소 여부를 빠르게 확인할 수 있다"며 "불성실한 자기소개서를 사전 필터링하는 것도 가능하다"고 밝혔다. 이어 "직무적합도나 심층 질문까지 제시해 주는 프리즘을 이용하면 인사 담당자들은 반복되는 서류 검토 외에 더욱 가치 있는 일에 집중할 수 있을 것"이라고 말했다.

 

AI 채용 플랫폼이 인사 담당자에겐 편의를 가져오지만 지원자에겐 또 하나의 장벽이 될 수 있다는 의견도 나왔다. 한 취업준비생은 "자기소개서에 자기소개와 장단점 등을 수많은 지원자와 차별되게 쓰긴 힘든 부분"이라며 "30%를 표절 의심으로 보았는데 과연 이 정도가 표절이 될 수 있는지 의문"이라고 말했다.

 

AI 스타트업에 근무하는 한 개발자는 "AI를 연구·개발하는 사람으로서 얘기하자면 AI가 문맥을 이해해 표절 여부를 확인하는 것은 100% 정확하다고 볼 수 없다"며 "채용담당자는 단순히 AI가 내린 결과를 보고 표절 여부를 확인하지 말고 직접 문서를 여러 번 검토하는 것이 필요하다"고 조언했다.

 

무하유는 2011년 표절 검사 서비스 '카피킬러'를 내놓은 데 이어 채용 솔루션 '프리즘' 등의 플랫폼을 개발·공급하고 있는 회사다. 대표 서비스 카피킬러는 클라우드형 대용량 전자문서 분석으로 1분 이내에 65억 건의 데이터를 기반으로 표절 검사를 진행한다. 카피킬러는 청와대부터 공기관, 학교 및 연구원, 사기업 등 2800여 개 기관에서 680만 명이 사용하고 있다. 2020년 일본 시장에도 진출해 메이지대학 등 명문 대학에도 도입됐다.

 

AI타임스 김동원 기자 goodtuna@aitimes.com

 

Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지

 

 

AI로 자기소개서 분석한 결과 "절반 가까운 문서가 표절 의심" - AI타임스

취업에 사용된 자기소개서 중 절반 가량은 표절이 의심되는 것으로 나타났다. 자연어 기반 인공지능(AI) 기업 무하유는 자사 AI 채용 솔루션 \'프리즘\'으로 작년 한 해 123만 건의 자기소개서를 분

www.aitimes.com