= 길어요. 스크롤 하시면 두줄 요약 있습니다.=




요즘 한국 게임계가 핫합니다. 

E3도 있겠지만 더 사람들의 이목을 끄는건 피시방 점유율.

200주가 넘는 기간동안 압도적 1위를 달리던 게임에 경쟁자가 나타났기 때문이죠.

굳이 특정게임의 팬이거나 게임업계에 있지 않아도  게이머라면 관심이 갈 수 밖에 없는 사건입니다.

스포 1위가 서든에 넘어갈때도 대단한 이슈였고, 서든이 1위를 내줄때도 당시 엄청난 이슈였죠.

암튼 매일 아침 업데이트 되는 겜트릭스의 점유율표에 많은 관심이 쏟아지고 있습니다.

 




그래프 출처 => 인벤 "달빛의노래"님 < http://www.inven.co.kr/board/powerbbs.php?come_idx=4677&l=927>



한국에서 게임순위를 체크할때 가장많이 인용되는 겜트릭스 피시방 점유율.

게임 판매량이나 포탈검색량등 여러 지표가 있음에도 왜 피시방 점유율이 주목을 받고 중요한가는

한국의 특수성과 피시방요금제 때문입니다. 더 자세히 들어가면 그걸로 너무 길어지기에 

다시 돌아가서, 

이렇게 다들 주목하는 겜트릭스의 수치는 얼마나 믿을만 하고 정확도가 얼마나 될까?



1. 전체피시방(모집단) 과 조사갯수(표본숫자)


한국콘텐츠진흥원에서 매년 "게임백서" 를 내놓고 있는데, 그 안에 피시방 통계도 나옵니다.

한국 피시방의 최전성기는 2001년 23,548개 였고 가장 최신의 자료에 나온 수치는 13,146개 입니다.

가장 좋은건 겜트릭스가 저 많은 피시방을 전수조사 하는 것이겠지만, 그걸 기대하긴 힘들죠.


대신 우리에게는 통계학이 있습니다.

통계학에서 흔히 많이 사용하는 신뢰도 구간은 90% 95% 99% 입니다.

높은 신뢰도의 자료가 당연히 더 좋은것이긴 하지만 그러기 위해서는 더 많은 표본숫자가 필요하죠. 

표본숫자의 증가는 당연히 비용의 증가. 

애시당초 통계학이란것이 전체를 조사하는 비용을 줄이고자 생겨난 방법론. 항상 돈이 문제.ㅋ 


----------------------------------------------------------------------------------
*게임트릭스는 전국에 있는 12,000 개의 PC방 모집단에서 대한민국 게임백서 지역별 비율에 따라 4,000개의 표본 PC방을 선정하여 게임 이용과 관련된 데이터를 분석하고 있습니다.
-----------------------------------------------------------------------------------
출처 - <http://www.gametrics.com/news/News02_View.aspx?seqid=27891>



게임백서의 마지막 자료가 전체피시방 숫자가 13000 여개 였는데, 그 사이에 또 줄었는지 

게임트릭스는 전국 피시방(모집단)을 12000 여개로 잡고 있습니다.

지역별 비율을 산정하다고 하는데 이 부분이 나름 중요한것이 무작위 추출로 뽑아버릴시

자칫 전국의 흐름이 아니라 특정지역(대도시,밀집지역)의 흐름을 반영하는 자료가 될 수도 있고

무작위 추출이 가지는 랜덤성,혹은 수집자의 의도성을 배제하는 장치로 볼 수 있습니다. 

그리고 가장 중요한 표본 숫자. 무려 !! 4000 개 입니다. 

모집단 대비 표본숫자가 30%에 달합니다.


혹자는 겨우 4000개? 라고 할지 모르지만, 통계학적으로는 엄청난 표본숫자 입니다. 

전국tv(수백만)의 시청율을 통계낼때 표본수가 3000개, 

정치관련 지지율 조사할때 수백만명의 인구 모집단이지만 그 조사대상(표본수)은 많아야 1000명.

그래도 신뢰도는 95% 신뢰도에 오차범위 +-5퍼 정도로 산출됩니다.




겜트릭스가 밝히고 있는 모집단 12000 , 표본숫자 4000 은 그렇다면 통계학적으로 어느정도의 신뢰도인가?



표본숫자 식이긴 한데, 간단하게 계산해주는 사이트를 이용.



                              <https://www.surveymonkey.com/mp/sample-size-calculator/>


겜트릭스의 모집단과 표본숫자가 맞다면,(허풍친게 아니라면) 

그들의 자료 신뢰도는

99% 신뢰도에 오차범위 +- 1.65% 의 정확도를 가지는 자료.

통계학에서 이정도 신뢰도와 오차범위면, 극최상의 자료라고 볼 수 있습니다.


"99%는 좋은데 오차범위가  +- 0 이 되게 할수 없나?"

+- 0 이 되는 순간은 모집단과 표본이 같아지는 순간. 즉, 표본추출이 아니라 전체조사를 해야 합니다.





2. 자료 읽는 방법


자료 읽을때 통계수치를 실제수치라고 인식하면 안됩니다.

표본추출 통계법이란게 전체에서 표본을 떼어내서 그 조각을 조사해서 전체를 "추정" 하는 것이기에

표본을 추출한 자료를 읽을때는 항상 오차범위를 챙겨합니다.


겜트릭스의 통계로 만약 A란 게임의 점유율이 30% 수치가 나왔다면,

실제로 전수조사(전체)를 조사 했을시  실제 점유율이 28.35~31.65% 사이로 나올 확율이 99%라는 말이 됩니다.


그리고 두 게임의 수치를 비교할때는 두 자료의 각 1.65% 오차범위가 겹치는(overlap) 구간이 있기에 

3.3 % (1.65 * 2) 이내 이면 수치가 우세하더라도 통계적으로 유의미한 격차는 아닙니다. 

자료를 통해서 유의미한 우세를 말할려면 3.3% 격차 이상이 되야 "앞서고 있다!" 라고 확실히 말 할수 있습니다.  

3.3% 안이라면 앞 설 확율이 있긴 하지만 "오차범위 안에서 경합 중(우위를 알수없다)" 이라고 읽어야 합니다. 



마지막 16일자의 자료 수치는 1위 와 2위의 차이가 2.03% 오차범위(3.3) 안이기에 

이 자료는 "1위와 2위는 오차범위 안에서 경합 중" 으로 읽으면 됩니다. 

롤/오버/서든/피온3 상위4개를 제외한 아래 게임들의 점유율은 서로 3.3 이내. 

5위 ~10위 순위가 매겨져 있고 그들끼리 오르락 내리락 하긴 하는데,

자료상의 점유율로는 오차범위 안의 사실상 의미없는 순위경쟁/등급매기기.






=두줄 요약=

1. 겜트릭스 자료는 공지가 거짓이 아니라면 최상급(99%신뢰도)의 통계 자료.

2. 순위를 논할때는 격차가 3.3% 이상 되야 한쪽이 앞선다고 말할 수 있다. 



.
.
.




에필로그


인텔의 시피유 , 엔당의 지포스 ,소니의 플포, 한국의 흉기차...

독(과)점의 폐혜, 어느 분야든 하나가 독주하기 시작하고 그 기간이 길어지면 질수록, 

소비자의 이익은 멀어질 수 밖에 없습니다. 

게이머 입장에서는 한쪽이 망해도 안되고 점유율 엎치락 뒤치락 하면서 서로 치고 박고 해주는게 이익.

이벤트라도 한번 더 할거고 스킨이라도 하나더 뿌릴거고 헬퍼 한명이라도 더 잡을테니.ㅋ


때로는 한걸음 물러서서 그들의 싸움을 즐깁시다.~ㅎ