신경망 모델의 의사 결정 과정을 설명 가능
분류에 영향을 미치는 개별 속성을 시각화
광범위한 도메인 및 분류기에 적용 가능
구글이 주어진 이미지에 대해 분류기(classifier)가 식별한 분류 결과에 대한 의미 있는 설명을 생성할 수 있는 새로운 기술을 도입했다. 이에 따라 이전에 불투명했던 분류 프로세스에 대한 새로운 통찰력을 제공하고 과학적 발견 프로세스를 지원하는 데 핵심적인 역할을 할 전망이다.
신경망은 특정 작업을 놀라울 정도로 잘 수행할 수 있지만 어떻게 결정에 도달하는지 이해하는 것은 종종 미스터리다. 신경 모델의 의사 결정 과정을 설명하는 것은 특히 의료 이미지 분석이나 자율 주행과 같이 고위험 분야에서 특히 중요하다. 이러한 통찰력은 의료 제공자를 안내하고, 모델 편향을 밝히고, 하위 의사 결정자를 지원하고, 과학적 발견을 지원하는 데에도 도움이 될 수 있다.
Grad-CAM과 같은 분류기의 시각적 설명에 대한 접근 방식은 이미지의 어떤 영역이 분류에 영향을 미치는지 강조하지만 색이나 모양과 같은 해당 영역 내의 어떤 속성이 분류 결과를 결정하는지 설명하지 않는다. Ganalyze와 같은 방법은 GAN을 이용하여 클래스간의 이미지 변환을 통해 설명을 제공하지만 한번에 모든 속성을 변경하는 경향이 있기 때문에 영향을 미치는 개별 속성을 분리하기 어렵다.
구글에서 공개한 StylEx는 분류기를 시각적으로 설명하기 위한 새로운 접근 방식을 제안한다. StylEx는 분류기에 영향을 미치는 속성을 자동으로 발견하고 시각화한다. 속성을 개별적으로 조작하여 개별 속성의 효과를 탐색할 수 있다. StylEx는 동물, 나뭇잎, 얼굴, 망막 이미지 등 다양한 영역에 적용할 수 있다. StylEx는 의미론적 속성과 잘 일치하는 속성을 찾고, 의미 있는 이미지별 설명을 생성하며, 사람들이 해석할 수 있음을 보여준다.
예를 들어, 주어진 이미지에서 고양이-개 분류기를 이해하기 위해 StylEx는 연관된 속성을 자동으로 감지하고 각 속성을 조작하는 것이 분류기 확률에 어떻게 영향을 미칠 수 있는지 시각화할 수 있다. 그런 다음 사용자는 이러한 속성을 보고 그들이 나타내는 것에 대한 의미론적 해석을 할 수 있다. 예를 들어, 위의 그림에서 "개는 고양이보다 입을 벌릴 가능성이 더 높다"(위 그림의 속성 #4), "고양이의 눈동자는 좁고 기다란 틈과 비슷하다"(속성 # 5), "고양이의 귀는 접히지 않는 경향이 있다"(속성 #1), 등등.
StylEx는 분류기와 입력 이미지가 주어지면 분류에 영향을 미치는 개별 속성을 찾고 시각화하려고 한다. 이를 위해 고품질 이미지를 생성하는 것으로 알려진 StyleGAN2 아키텍처를 활용한다. 목표는 이미지의 특정 속성을 변경하여 주어진 이미지의 분류를 설명하고 이것이 분류기 출력에 영향을 미친다는 것을 보여주는 것이다.
StylEx는 생성기(Generator), 분류기(Classifier) 및 인코더(Encoder)를 동시에 훈련한다. 훈련 단계에서 입력 이미지는 인코더를 통해 잠재 벡터로 변환되어 이미지의 의미론적 속성을 포함하는 ‘StyleSpace’를 구성한다. 그런 다음 생성기에 의해 원본 이미지에 가까운 이미지를 생성하는 데 사용된다. 생성된 이미지와 원본 이미지 사이 및 해당 인코더 출력 사이에 분류 손실(classification loss)을 적용한다.
분류 손실을 추가해 생성된 이미지에 대한 분류기 확률이 입력 이미지에 대한 분류기 확률과 동일하도록 한다. 이렇게 하면 분류에 중요한시각적 세부 정보(예: 의료 병리)가 생성된 이미지에 포함된다. 예를 들어, 망막 이미지에 대해 훈련된 GAN은 특정 질병에 해당하는 병리를 반드시 시각화하지는 않지만 GAN 훈련 중에 GAN에 의해 생성된 이미지에 분류 손실을 추가하면 병리가 생성된 이미지내에서 나타나게 된다. 이 손실은 생성기가 분류에 의미 있는 중요한 세부 사항을 무시하거나 레이블 중 하나로 축소되지 않도록 한다.
훈련을 마치면 훈련된 생성기의 StyleSpace에서 분류기에 영향을 미치는 속성을 검색한다. 이를 위해 각 StyleSpace 좌표를 조작하고 분류 확률에 대한 영향을 측정한다. 주어진 이미지에 대한 분류 확률의 변화를 최대화하는 상위 K개의 속성을 제공한다. 클래스당 많은 수의 이미지에 대해 이 프로세스를 반복 하면 분류기가 특정 클래스에 대해 학습한 내용을 알려주는 상위 K개의 클래스별 속성을 추가로 발견할 수 있다.
인식된 성별 및 연령 분류기의 경우 분류기당 감지된 상위 4개 속성은 다음과 같다. StylEx는 해당 속성을 가장 잘 보여주기 위해 자동으로 선택된 여러 이미지의 각 속성을 예시한다. 각 속성에 대해 원본 이미지와 속성을 조작한 이미지 사이에서 깜박거린다. 속성 조작이 분류기 확률에 영향을 미치는 정도는 각 이미지의 왼쪽 상단 모서리에 표시된다..
StylEx는 주어진 분류기가 데이터에서 활용하도록 학습한 이미지 속성을 나타내도록 설계되었다. 이러한 속성은 실제로 클래스 레이블(예: 더 젊거나 더 오래된 연령) 간의 실제 물리적 차이를 반드시 특성화하지 않을 수 있다. 특히, 이러한 감지된 속성은 분류기 훈련 또는 데이터 세트의 편향을 드러낼 수 있으며, 이는 우리 방법의 또 다른 주요 이점입니다. 예를 들어, 우리 방법이 드러내는 편향을 보상하는 예제로 훈련 데이터 세트를 보강함으로써 신경망의 공정성을 개선하는 데 더 사용할 수 있습니다.
StylEx는 200가지 조류 종 분류기에서 입증된 바와 같이 다중 클래스 문제에도 적용할 수 있다.
AI타임스 박찬 위원 cpark@aitimes.com
Copyright © '인공지능 전문미디어' AI타임스 (http://www.aitimes.com/)
무단전재 및 재배포 금지
'AI산업' 카테고리의 다른 글
속도 붙은 친환경차, 전년 대비 41% 이상 증가...경유차는 감소세 (0) | 2022.02.04 |
---|---|
테슬라, 5만4000대 리콜...끝없는 자율주행 소프트웨어 결함 (0) | 2022.02.04 |
"날아서 출근해요" SKT-교통연구원, UAM 상용화 앞당긴다 (0) | 2022.01.26 |
글로벌 석학 '핫플' 네이버... AI·검색 분야에 세계적 전문가 영입 (0) | 2022.01.25 |
[단독]LG, 분야별 8개사와 '엑사원 연대' 구축...초거대 AI 상용화 발판 (0) | 2022.01.24 |