<미리 세줄요약>
1] "사냥과 코어젬스톤 확률 2편"에서는 정규분포가 아닌 값에 t-test를 적용해 통계적으로 문제가 있다.
2] 하지만 분포에 맞게 확률을 구해 보아도 결론은 같다.
3] 원글 작성자님 정말 고생하셨고, 제 글도 기니까 여러분도 고생하실 것입니다.

"사냥과 코어 젬스톤 확률 2편" 링크입니다.
https://www.inven.co.kr/board/maple/2304/29453
(위 게시글의 작성자와 저는 다른 사람입니다.)

위 게시글은 드랍률 234%일 때와 드랍률 256%일 때의
1재획 당 코어젬스톤 획득 개수에 차이가 있는지,
보다 정확하게 말하자면 드랍률 로직이 우리 생각대로 잘 적용되고 있는지를 
분석하기 위한 글이었습니다.

사실 위 글에는 치명적인 오류가 하나 있는데,
정규분포를 따르지 않는 통계량에
정규분포에 사용하는 검정 방식(t-test)을 사용했다는 것입니다.
이럴 경우 검정 결과 자체를 신뢰할 수 없게 됩니다.

코어 젬스톤 획득 개수 자체는 이항분포를 따르며,
이항분포는 특정 조건에서 정규분포로 근사할 수 있기 때문에
획득한 코어젬스톤 개수는 정규분포를 따른다고 보아도 무방합니다.

단, 이것을 가공한 값인
젬/마리, 마리/젬, 분/젬, 젬/1재획, 마리/1재획 등은 그렇지 않은데,
위 글의 작성자께서는 마리수/젬 값을 사용해 t-test를 돌리셨습니다.
마리수/젬은, "몇 마리를 잡아야 코어젬스톤 하나가 드랍되느냐"를 나타내는 값으로
정규분포가 아닌 음이항분포 (보다 세부적으로는 기하분포)를 따르게 됩니다.

그래서 원글의 "확률로 그래프 그리기"에서
그래프가 (모든 정규분포의 모양인) 좌우대칭 형태가 되지 않고
오른쪽 꼬리가 긴 형태를 가지는 것입니다.

그래서 저는 조금 다른 방식으로 이 문제에 접근하려고 합니다.
젬/1재획 값을 사용할 텐데,
"1재획을 할 동안(120분 동안) 몇 개의 코어 젬스톤을 얻을 수 있느냐"를 나타내기 때문에
이 값은 포아송 분포를 따르게 됩니다.
포아송 분포는 평균이 클수록 정규 분포와 비슷해지기는 하지만
정규분포로 취급하지 않고 
그냥 통계 프로그램인 R을 이용해 계산해 보겠습니다.


원 게시글에 올라온 자료에서, "코젬" 열에 있는 값들만 모아 왔습니다.
low_rate는 "1차 아이템 드랍률" (234%),
high_rate는 "2차 아이템 드랍률" (256%) 상황에서 얻은 데이터입니다.

만약 드랍률 로직이 제대로 적용 됐다면,
드랍률 234% 상황에서는 원래 드랍되는 양의 3.34배,
드랍률 256% 상황에서는 원래 드랍되는 양의 3.56배에 상응하는
코젬을 얻을 수 있어야 합니다.

low_rate 상황을 기준으로
추가 드랍률 0%일 때 드랍되는 개수(original)를 추정해 보면,


약 8.8개 입니다.
즉, 원글 작성자님이 사냥한 환경에서 추가 드랍률이 0%가 되면
1재획 당 8~9개의 코젬이 평균적으로 드랍된다는 것입니다.

그렇다면 추가 드랍률이 256%일 때(high_drop)는 어떨까.

약 31.4개로 추정할 수 있겠습니다.

우리는 드랍률 256%일 때 평균 31~32개의 코젬이 드랍되는 게
올바른 상황이라고 가정하고,
원글 작성자님의 자료가 통계적으로 유의미하게 위 가정에 위배되는지
알아보려고 합니다.

아래의 코드는
"실제로 평균적으로 1재획 당 31.4개의 코젬이 드랍되는 상황일 때,
원글 작성자님의 데이터에서의 평균치보다 적게 코젬이 드랍될 확률은 얼마인가?"
를 구하는 구문입니다.


대략 37.92%로 계산됩니다.
통계학에서는 주로 5%를 기준으로 판단합니다.
그런 상황이 일어날 확률이 5% 미만이라면
가정이 잘못됐다 = 우리가 생각하는 드랍 로직이 적용되고 있지 않다
라는 결론을 내릴 수 있는데, 지금은 그럴 수 없습니다.

결국 드랍률 로직이 제대로 적용되고 있지 않다는 결론은
이 데이터를 통해서는 얻을 수 없습니다.
단, 이것이 "드랍률 로직이 잘 적용되고 있다"라는 말은 또 아닙니다.
이번 자료로는 그것을 증명할 수 없다는 정도로만 받아들이시면 될 것 같습니다.

+) 참고로 원글에서의 43번 데이터,
드랍률 256%일 때 1재획 = 18코젬이었던 상황이
얼마나 운이 없었는지 알아봅시다.

네.. 하위 0.6% 정도의 운이었습니다.
이 날은 재획이 아니라 23성 도전을 했어야 하지 않나 하는 아쉬움이 있습니다.


오류는 언제나 지적해 주시면 감사합니다.
저는 또 다른 통계 떡밥이 돌 때 다시 오겠습니다.