av 장면들을 학습해서 원하는 키워드에 맞는 av 장면들을 자연스럽게 연결해서 하나의 av를 주는거지