미국 캘리포니아 샌디에이고 대학의 한 연구팀이 온라인 리뷰에 존재하는 '스포일러'를 식별하는 인공지능 기반 시스템을 개발했다. 해당 연구팀은 이탈리아에서 곧 개최죄는 컴퓨터 언어학 연래 회의를 통해 그들의 연구 결과를 발표할 예정이다.

UC 샌디에이고의 컴퓨터과학 교수 은다파 나카쇼레(Ndapa Nakashole) 교수는 "스포일러는 인터넷 어디에나 존재하며, 특히 소셜 미디어에서 예기치 않게 마주하는 경우가 많다"며, "인터넷 이용자로서 우리는 스포일러가 한 사람의 경험을 어떻게 망치는지 잘 알고 있다"고 이와같은 연구를 진행하게 된 계기를 밝혔다.

샌디에이고 대학 연구진은 자신들이 개발한 신경망 네크워크에 스포일러넷(SpoilerNet)이라는 이름을 붙였다. 연구진은 스포일러넷을 훈련시키기 위해 아마존이 보유한 소셜 카탈로그 사이트 '굿리드'에 스포일러 태그가 붙은 리뷰 130만 개를 수집했으며, 스포일러넷은 소설 리뷰 중 약 89%~92%의 스포일러를 찾아내는 정확도를 발휘했다.

소설이 아닌 TV 등 영상매체에 대한 훈련은 880종의 TV쇼로부터 수집한 16,000여 개의 한 문장으로 된 설명문을 활용했다. 이 때 스포일러넷은 소설 리뷰보다 낮은 74에서 80%의 정확도를 보였다. 샌디에이고 대학 연구진에 따르면 오류 대부분은 '살인(Murder)'나 '살인(Killed)'과 같이 다른 의미로도 자주 쓰이는 단어에 의해서 일어났다고 발혔다.

샌디에이고 대학의 이번 연구는 단순히 사람들이 스포일러를 피할 수 있도록 돕는 시스템을 개발하는 데 초점을 두지 않았다. 연구진은 앞으로 사람들이 어떤 방식으로 인터넷에 스포일러를 쓰는지, 또한 어떤 종류의 언어 패턴과 일반 지식으로 문장을 표시하는지 등을 이해하기 위한 연구를 지속할 전망이다.