Abcd3984
2021-12-16 15:58
조회: 22,621
추천: 27
통계학도의 "사냥과 코어 젬스톤 확률 2편" 보충<미리 세줄요약> 1] "사냥과 코어젬스톤 확률 2편"에서는 정규분포가 아닌 값에 t-test를 적용해 통계적으로 문제가 있다. 2] 하지만 분포에 맞게 확률을 구해 보아도 결론은 같다. 3] 원글 작성자님 정말 고생하셨고, 제 글도 기니까 여러분도 고생하실 것입니다. "사냥과 코어 젬스톤 확률 2편" 링크입니다. https://www.inven.co.kr/board/maple/2304/29453(위 게시글의 작성자와 저는 다른 사람입니다.) 위 게시글은 드랍률 234%일 때와 드랍률 256%일 때의 1재획 당 코어젬스톤 획득 개수에 차이가 있는지, 보다 정확하게 말하자면 드랍률 로직이 우리 생각대로 잘 적용되고 있는지를 분석하기 위한 글이었습니다. 사실 위 글에는 치명적인 오류가 하나 있는데, 정규분포를 따르지 않는 통계량에 정규분포에 사용하는 검정 방식(t-test)을 사용했다는 것입니다. 이럴 경우 검정 결과 자체를 신뢰할 수 없게 됩니다. 코어 젬스톤 획득 개수 자체는 이항분포를 따르며, 이항분포는 특정 조건에서 정규분포로 근사할 수 있기 때문에 획득한 코어젬스톤 개수는 정규분포를 따른다고 보아도 무방합니다. 단, 이것을 가공한 값인 젬/마리, 마리/젬, 분/젬, 젬/1재획, 마리/1재획 등은 그렇지 않은데, 위 글의 작성자께서는 마리수/젬 값을 사용해 t-test를 돌리셨습니다. 마리수/젬은, "몇 마리를 잡아야 코어젬스톤 하나가 드랍되느냐"를 나타내는 값으로 정규분포가 아닌 음이항분포 (보다 세부적으로는 기하분포)를 따르게 됩니다. 그래서 원글의 "확률로 그래프 그리기"에서 그래프가 (모든 정규분포의 모양인) 좌우대칭 형태가 되지 않고 오른쪽 꼬리가 긴 형태를 가지는 것입니다. 그래서 저는 조금 다른 방식으로 이 문제에 접근하려고 합니다. 젬/1재획 값을 사용할 텐데, "1재획을 할 동안(120분 동안) 몇 개의 코어 젬스톤을 얻을 수 있느냐"를 나타내기 때문에 이 값은 포아송 분포를 따르게 됩니다. 포아송 분포는 평균이 클수록 정규 분포와 비슷해지기는 하지만 정규분포로 취급하지 않고 그냥 통계 프로그램인 R을 이용해 계산해 보겠습니다. 원 게시글에 올라온 자료에서, "코젬" 열에 있는 값들만 모아 왔습니다. low_rate는 "1차 아이템 드랍률" (234%), high_rate는 "2차 아이템 드랍률" (256%) 상황에서 얻은 데이터입니다. 만약 드랍률 로직이 제대로 적용 됐다면, 드랍률 234% 상황에서는 원래 드랍되는 양의 3.34배, 드랍률 256% 상황에서는 원래 드랍되는 양의 3.56배에 상응하는 코젬을 얻을 수 있어야 합니다. low_rate 상황을 기준으로 추가 드랍률 0%일 때 드랍되는 개수(original)를 추정해 보면, 약 8.8개 입니다. 즉, 원글 작성자님이 사냥한 환경에서 추가 드랍률이 0%가 되면 1재획 당 8~9개의 코젬이 평균적으로 드랍된다는 것입니다. 그렇다면 추가 드랍률이 256%일 때(high_drop)는 어떨까. 약 31.4개로 추정할 수 있겠습니다. 우리는 드랍률 256%일 때 평균 31~32개의 코젬이 드랍되는 게 올바른 상황이라고 가정하고, 원글 작성자님의 자료가 통계적으로 유의미하게 위 가정에 위배되는지를 알아보려고 합니다. 아래의 코드는 "실제로 평균적으로 1재획 당 31.4개의 코젬이 드랍되는 상황일 때, 원글 작성자님의 데이터에서의 평균치보다 적게 코젬이 드랍될 확률은 얼마인가?" 를 구하는 구문입니다. 대략 37.92%로 계산됩니다. 통계학에서는 주로 5%를 기준으로 판단합니다. 그런 상황이 일어날 확률이 5% 미만이라면 가정이 잘못됐다 = 우리가 생각하는 드랍 로직이 적용되고 있지 않다 라는 결론을 내릴 수 있는데, 지금은 그럴 수 없습니다. 결국 드랍률 로직이 제대로 적용되고 있지 않다는 결론은 이 데이터를 통해서는 얻을 수 없습니다. 단, 이것이 "드랍률 로직이 잘 적용되고 있다"라는 말은 또 아닙니다. 이번 자료로는 그것을 증명할 수 없다는 정도로만 받아들이시면 될 것 같습니다. +) 참고로 원글에서의 43번 데이터, 드랍률 256%일 때 1재획 = 18코젬이었던 상황이 얼마나 운이 없었는지 알아봅시다. 네.. 하위 0.6% 정도의 운이었습니다. 이 날은 재획이 아니라 23성 도전을 했어야 하지 않나 하는 아쉬움이 있습니다. 오류는 언제나 지적해 주시면 감사합니다. 저는 또 다른 통계 떡밥이 돌 때 다시 오겠습니다.
EXP
78
(78%)
/ 101
Abcd3984
|
인벤 공식 앱
댓글 알람 기능 장착! 최신 게임뉴스를 한 눈에 보자