"데이터 분석이란 아파서 병원을 가면 검진을 통해 통증의 원인을 찾는 과정과도 같습니다."


최근 몇 년간 주요 이슈로 떠오르고 있지만 실제 활용되는 영역은 소셜게임이나 마케팅 활동에 그치고 있는 데이터 분석에 대해 박훈 팀장은 이런 비유를 들었다.


데이터 분석이 사용되지 않는다면 정확한 원인을 파악하기 힘들다는 것. 예를 들어 어느 날 갑자기 동접이 폭락한 어느 게임. 게시판에 올라온 고레벨 콘텐츠에 대한 불만이 있는 것을 확인해 고레벨 콘텐츠를 추가하는 패치를 단행했지만, 뚜껑을 열어보니 매출과 동접이 떨어져있다면.


이런 일들이 일어나는 이유는 문제에 대한 원인규명을 제대로 하지 않았기 때문이라며, 설사 패치가 성공해 '패치의 신'으로 불리더라도 알고보면 운이 좋았던 것인데 실력으로 믿게 되는 부작용이 생긴다는 것이다. 그나마 라이브 게임이라면 다시 패치를 하면 되지만, 3년에서 5년의 개발기간이 걸린 신작게임에서는 그런 식의 '찍기'는 위험하다는 것.


최근 GDC 등에서 데이터 분석이 주목받고 있는 이유도 여기에 있다. 수십개의 온라인 게임이 출시되어 뜨거운 경쟁을 펼쳐야 하는 시대에서는 '만드는 것'보다 '잘 만드는 것'이 중요해졌기 때문이다.


하지만 데이터 분석이 '우리 게임 잘 될까' 라거나 '앞으로 어떻게 하면 잘 될까'의 해답을 줄 수 있다는 환상이나, '게임은 장인정신으로 만들어야 된다'거나 '재미를 어떻게 정량화 하느냐', '데이터 분석이 창의력을 제한한다'는 오해 역시 존재한다고 박훈 팀장은 덧붙였다.






데이터 분석의 과정 - 식당의 신메뉴 개발과도 같다


박훈 팀장은 데이터 분석의 과정이 식당의 신메뉴 개발 과정과 비슷하다면서 실제 분석 과정을 예를 들어가며 설명했다.


데이터 분석의 첫번째 단계는 메뉴를 선택하는 것. 이때 중요한 것은 실질적으로 궁금한 사항을 구체적으로 나열해야 하는 것이라고. 이를테면 '하위 20% 유저의 튜토리얼 단계별 실패율은 얼마나 되는가'라던가 '퀘스트 성공율과 이탈율의 관계는 반비례하는가', 'SMS 프로모션은 언제 누구에게 어떻게 할 것인가'와 같은 구체적인 분석주제를 선택해야 한다.


두번째 단계는 재료를 준비하고 손질하는 과정. 요리의 생명이 신선한 재료인 것과같이 데이터 분석도 양질의 데이터가 중요하다고 강조한 박훈 팀장은, 작은 데이터부터 수집하고 양이 중요한 것인지, 패턴이 중요한 것인지 잘 구분해야 한다고 안내했다.


세번째는 조리과정. 실제 데이터를 분석할 때는 넓은 범위에서 좁은 범위로, 고렙레과 저레벨 같이 비교대상을 만들 것, 분석 기간이 너무 오래 진행되지 않도록 주의할 것이 요구된다. 네번째는 시식. 데이터 분석 결과를 보면 시나리오와 맞거나 다르거나 하는데, 자주 의도하지 않았지만 새로운 경향을 찾게되는 경우가 있다고 한다.


이후에는 데이터 분석을 통해 도출된 결과를 기반으로 기획이 진행되고, 데이터 분석의 주제나 진행상황, 결과를 요리사가 레시피를 기록하듯 기록하는 것이 중요하다고.


국내 게임사들 중 몇 안되는 데이터 분석팀을 갖고 있는 넥슨이지만, '삽질'은 피할 수 없었다고 박훈 팀장은 고백했다.


'하루에 다루는 테이터가 몇 십테라'라는 식으로 데이터의 양에 치중하느라 시간이 너무 길어진 일, 너무 많은 데이터 속에서 원하는 정보를 얻기 힘들었던 일들이 사례로 소개되었다. 또 데이터을 전문으로 다루는 분석도구는 언리얼3 정도의 가격이 나가기 때문에 엑셀이나 SQL만으로도 충분하다며, 분석은 다양하고 과감하게 하더라도 게임에 적용할 때는 이벤트 등으로 조심스럽게 접근해야 한다고.







데이터 분석. 활용 가능한 사례와 역할


박훈 팀장은 데이터 분석에서 평균의 함정을 조심해야 한다면서, 분석 전반에 걸쳐 이 부분의 주의가 필요하다는 말과 함께 데이터 분석을 실제 활용하는 사례들에 대해 소개했다.





분류기준을 다양화 해 접근하면, 레벨 이외에도 이탈유저, 부자유저, 실력에 따른 분류, 가입기간에 따른 분류에 대해 각각의 데이터를 뽑아볼 수 있다며, 특정 패치가 가입기간에 따른 유저그룹에 따라 어떤 동접 변화수치를 살펴보는 예를 들기도 했다.


또 게임의 업데이트나 변경 내용을 빠르게 확산시키기 위해 유저들 사이의 관계도를 이용하거나, DQA (Data Driven Quality Assurance) 를 이용한 플레이 기록 시스템 감지로, 어뷰저나 해킹시도, 기획적 오류를 발견할 수도 있음을 예로 들었다.


또 유저 그룹을 설정해 지속적으로 관찰하면 이벤트나 패치의 효과 분석이 가능해, 컨트롤 실력이 부족한 유저나 방학 프로모션에 반응하는 유저 들의 이용패턴도 확보할 수 있다고.





박훈 팀장은 데이터 분석이 '홈런타자'가 아닌 '안타타자'를 지향하는 것과 같다면서, 드라마틱한 한 방이 아니라 전체적인 상승을 이끌 수 있다고 강조했다. 대규모 패치를 적용하기 전에 적은 비용으로 예상되는 문제를 미리 파악할 수 있는 실험실로 데이터 분석을 생각한다면, 기존에 가지고 있던 감이나 지식을 분석을 통해 검증할 수 있다는 것이다.