이미지 3

김일두 카카오브레인 대표 "세계 최대 규모 AI 멀티모달 모델 곧 공개할 것"

초거대 AI 멀티모달 '민달리' 공개한 지 이틀 만에 텍스트와 이미지 동시에 다루는 AI 기술 LG AI 연구원의 '엑사원'과 경쟁 구도 예상 "시각적 정보와 텍스트 정보의 결합 많아질 것" 김일두 카카오브레인 대표가 세계 최대 규모 멀티모달(multi-modality) 공개를 예고했다. 초거대 AI 멀티모달 '민달리(minDALL-E)'를 글로벌 오픈소스 커뮤니티인 깃허브에 공개했다고 밝힌 지 이틀 만이다. 김일두 대표는 17일 열린 '오픈 미니 컨퍼런스'에서 "글로벌 최대 규모 멀티모달 데이터셋을 구축하고 모델과 함께 공개할 계획"이라며 "이 기반이 되는 최고 수준의 인프라를 구축하는 사업을 진행해 원 엑사플롭(exaflops)이 넘는 인프라를 구축하고 연구에 활용하고 있다"고 밝혔다. 멀티모달은 언..

AI산업 2021.12.20

엔비디아, AI 디자인 도구 기능 강화...스케치부터 편집까지 만능키 역할 톡톡

새로운 디자인 도구로 AI 각광 문장을 그림으로 구현하는 '고갱2' 출시 화상회의 모습 자동 변경해주는 디자인 툴 선보여 오래된 사진 쉽게 복원하고, 동물 표정과 포즈 접목하는 디자인 툴 제작 365일 지치지 않고 불평불만하지 않는 디자인 조수가 등장했다. 인공지능(AI)이다. 엔비디아 AI 연구원들로 구성된 엔비디아 리서치팀은 적대적 생성 신경망(Generative Adversarial Networks, GAN)을 기반으로 한 AI 디자인 툴을 계속 선보이고 있다. GAN은 두 개의 네트워크로 구성된 심층 뉴럴 네트워크 구조로 한 네트워크가 다른 네트워크와 서로 대립해 경쟁하는 방식으로 학습을 진행하는 기술이다. 엔비디아가 선보인 디자인 툴에는 문구를 입력하면 AI가 실시간으로 해당 장면을 그려주는 스..

AI테크 2021.11.30

[Hoxy… AI개발자세요?] 문과 졸업생이 어떻게 CVPR에 AI논문을 게재하게 되었나...이상록 연구원 인터뷰

차량 정보 키워드로 입력하면 AI가 카메라에 촬영되는 해당 차량 탐지 자연어와 이미지 결합 기술로 의미 있는 결과 돌출 인문대 졸업 후 머신러닝 연구성과 관심 갖고 AI 공부 모두의연구소에서 AI 배우고 랩에서 연구 진행 도로를 달리는 수많은 자동차 중 특정 차량을 키워드로 찾아내는 연구가 국내 연구진에 의해 이뤄졌다. '빨간색 승용차', '검은색 SUV' 등 키워드를 입력하면 도로 위 카메라에 촬영된 자동차 중 해당 차량을 인공지능(AI)이 찾아내는 방식이다. 해당 연구가 담긴 논문은 3대 컴퓨터비전 분야 국제 학술대회로 꼽히는 CVPR(컴퓨터 비전 및 패턴인식 학회, Computer Vision and Pattern Recognition)에 게재됐다. 논문명은 'SB넷: 자연어로 차량 탐지를 위한 분..

AI초대석 2021.08.23