인코더 2

[GTC 2022] KT, GPT-3 뛰어넘는 언어모델 만든다

GTC 2022에서 새로운 초거대 AI 언어모델 기능 공개 인코더와 디코더 모두 갖춘 '인코더-디코더 아키텍처' 인간과 자연스러운 소통 추구, 언어이해와 생성 가능 "300억 개 파라미터로 학습 중, 2000억 개로 늘릴 것" KT가 기존 언어모델을 뛰어넘는 새로운 초거대 AI 모델을 개발하고 있다고 밝혔다. 스마트 스피커, 콜센터, 로보틱스 등 다양한 분야에 인공지능(AI) 기술을 적용하고 있는 만큼 차별화된 언어모델이 필요한 까닭이다. KT가 개발하고 있는 언어모델은 구글 '버트(BERT)'와 오픈AI의 'GPT-3'의 개량된 버전이 될 것으로 전망된다. 서영경 KT 연구원은 24일 세계 최대 AI 개발자 컨퍼런스로 불리는 엔비디아 GTC 2022에서 KT가 개발 중인 차세대 언어모델을 공개했다. 서..

AI산업 2022.03.25

구글, 신경망 모델을 시각적으로 설명하는 기술, StylEx 공개

신경망 모델의 의사 결정 과정을 설명 가능 분류에 영향을 미치는 개별 속성을 시각화 광범위한 도메인 및 분류기에 적용 가능 구글이 주어진 이미지에 대해 분류기(classifier)가 식별한 분류 결과에 대한 의미 있는 설명을 생성할 수 있는 새로운 기술을 도입했다. 이에 따라 이전에 불투명했던 분류 프로세스에 대한 새로운 통찰력을 제공하고 과학적 발견 프로세스를 지원하는 데 핵심적인 역할을 할 전망이다. 신경망은 특정 작업을 놀라울 정도로 잘 수행할 수 있지만 어떻게 결정에 도달하는지 이해하는 것은 종종 미스터리다. 신경 모델의 의사 결정 과정을 설명하는 것은 특히 의료 이미지 분석이나 자율 주행과 같이 고위험 분야에서 특히 중요하다. 이러한 통찰력은 의료 제공자를 안내하고, 모델 편향을 밝히고, 하위 ..

AI산업 2022.01.27