자료제공 - 엔씨소프트


엔씨소프트(공동대표 김택진, 박병무, 이하 엔씨(NC))가 AI 분야 최대 규모 국제학술대회 ‘ICASSP(International Conference on Acoustics, Speech and Signal Processing) 2024’에 논문을 게재했다고 18일 밝혔다.

ICASSP는 매년 전 세계 각국에서 개최되는 국제학술대회다. 올해는 49회를 맞아 서울 코엑스에서 진행된다. 행사에는 전 세계 과학자 4,000여 명이 참석해 신호처리 기술을 비롯한 각종 멀티모달 생성형 AI 기술을 발표한다.

엔씨(NC)는 이번 ‘ICASSP 2024’에 ▲멀티모달 언어모델의 시각적 환각 현상 완화 ▲열악한 환경 속 얼굴 인식 정확성 개선 ▲사용자 음성을 깨끗하게 걸러내는 호출어 인식 모델 ▲얼굴 이미지에 맞는 가상 음성 생성 시스템 등 총 4편의 논문을 게재했다.

엔씨(NC)가 발표한 논문들은 실질적 활용을 위한 ‘AI 응용 기술’과 함께 텍스트, 이미지, 비디오, 음성 등 다양한 데이터를 이해하고 학습하는 ‘멀티모달 언어모델 기술’의 활용 가능성을 다루고 있다는 점에서 의미가 있다.

엔씨소프트는 이번 연구 결과를 기반으로 텍스트, 이미지, 오디오 등 다양한 분야에서 멀티모달 데이터를 이해하는 AI 기술을 발전시켜 게임 개발에 활용할 계획이다. ‘ICASSP 2024’ 게재 논문 4편에 대한 자세한 내용은 엔씨(NC) 공식 블로그를 통해 확인할 수 있다.