마이크로 소프트가 위 영상들을 만들기 위해 필요했던 것?

사진 단 1장 + 음성오디오







마이크로소프트가 오늘 공개한 VASA-1은

정밀한 입술-음성 동기화를 생성할 수 있을 뿐만 아니라,

사실감과 생동감에 기여하는 다양한 감정, 표현이 풍부한 얼굴 뉘앙스,

그리고 자연스러운 머리 움직임까지 생성가능하다고