17:50 추가)
 boxplot의 좌우 폭을 가지고 직업의 저점-고점으로 그대로 직결해서 생각하시는 경우가 있는데 해석에 주의가 필요합니다. 저번 분석과 이번 분석에서 큰 차이를 보인 특화 사멸(잔재/난무/강무 등)에서도 알 수 있듯 샘플사이즈가 작은 직업들의 경우 편차가 적다면 그건 그냥 유저풀이 작고 소수의 유저로부터 나온 클리어 기록이라 그럴 가능성이 있습니다. 따라서 클리어 건수가 지나치게 작은 직업들은 순수하게 참고용으로만 봐주셨으면 합니다(e.g. 유산). 

또 본문의 상하위권 DPS 편차를 난이도와 동일시하는 것은 명확히 <틀린> 관점입니다.단순히 쉬워서 고점이 막힌 직업도 있지만, 앞서 서술한 것처럼 유저풀이 제한되고 고여있는 직업이거나 딜 구조의 문제로 고점이 막혀있는 경우도 있습니다. 이번 분석은 단순히 직각별 "실전 DPS 편차"를 보여준 것 뿐이고, 그걸 해석하는 관점은 다양하게 제시되어야 합니다.

19:20 추가)

그래프 정렬에 하위 25% 저점을 기준으로 정렬한 것도 함께 포함하였습니다.
해당 직각 유저분들께는 죄송하지만 샘플 사이즈 기준 문턱이 너무 낮다 싶어서 30건 미만인 유산, 핸드거너 등의 기록은 제외하고 다시 시각화하였습니다. 제보해주신 Slkdj님께 감사드립니다.


안녕하세요. 저번에 올린 북미 로그데이터 글에 많은 반응이 있었습니다. 며칠간 이를 반영해서 추가 데이터 수집과 분석을 해본 결과를 공유합니다. 요약부터 나갑니다.

1. 데이터 크기 8배 늘렸고 템렙 감안해서 보정 DPS 계산했습니다.
2. 샘플 증가했지만 상하위 직각 사이 격차, 환경 변수 등의 결론은 큰 변함은 없습니다 
3. 저번에 없었던 직각도 추가했고 샘플수 적어서 이상하게 튀었던 애들도 꽤 직관과 부합하게 나왔습니다.
4. 데이터 공유할테니 궁금한 사람들 직접 분석해보세요.

결과 궁금하신 분들은 <분석 결과> 파트부터 보세요.



<샘플사이즈 1만건 이상 확보>

저번에 올린 글을 원래 영어로 번역해서 로그 사이트 디코에 올릴 생각이었는데, 제가 작업하기도 전에 누가 번역기 돌려서 공유를 해버렸더라고요. 다행히 얘기가 잘 풀려서 개발자 친구와도 얘기를 나눴고 공식적으로 API를 제공받아서 훨씬 쾌적하게 많은 데이터를 수집할 수 있었습니다. 

기존에 수집했던게 1, 3관 합쳐서 2천건이 안 되는데 API 써서 3관문만 6600건을 긁었으니 훨씬 양적으로 풍부해진 셈이죠. 디코 사람들과도 좀 얘기를 나눴는데, 글섭에서도 카멘 대비하며 1630 올린 사람들 많은데 그거 다 제외하는건 좀 아닌 것 같다는 의견이 있었습니다. 따라서 데이터 필터링 기준을 다음과 같이 변경하였습니다.

- 버스나 DPS가 지나치게 낮은 기록, 빠르게 팀원 사망한 경우는 계속 제외
- 최근 2개월 기록 사용: 참고로 북미 최신 밸패는 1월 초에 있었고 버스트/브레이커 너프와 최근의 실린버프를 제외하고는 한국과 같습니다
- 폿 제외
- 10건 미만 직각 4종 제외: 교감/화강/사시/중수... 안타깝네요...

이렇게 필터링한 결과 1, 3관문 전체 13000여건 가운데 딜러 유효 기록은 약 9000건이 나왔습니다. 관문으로 따지면 1, 3관 각 4500건 정도입니다.


<유저 스펙 보정>



템렙컷을 제거하는 대신 오버레벨 캐릭터의 스펙 보정을 도입하기로 했습니다. 당연히 템렙 높으면 DPS는 높아집니다. 근데 모든 직각의 샘플이 동일한 템렙을 가진게 아니었습니다. 이번에도 타 직각 대비 3~4 가까이 높은 직각들이 있었습니다. 수상할 정도로 돈이 많은 광기, 현실 아이언맨이라도 되나 싶은 유산 등...



따라서 회귀분석을 돌려서 템렙과 DPS의 상관관계를 구하고 그 값만큼 보정치를 적용했습니다. 계산 결과 템렙 1이 오를때마다 실전 DPS는 약 65만 정도가 상승합니다. 전체 유저들의 실전 DPS 중간값은 2400만 정도이므로 템렙 1이 오를 때마다 약 2.7% 정도 DPS가 상승하는 효과인 셈이므로 이만큼을 빼서 보정 DPS로 넣었습니다. 실제 템렙에 따른 딜 상승량보다는 크게 효과가 잡혔지만 한섭과 마찬가지로 템렙이 높은 유저는 보통 팔찌, 엘릭서, 보석 등의 스펙도 높은 편이므로 과도한 보정이라 생각하지는 않습니다.


<분석 결과>




직각 우측의 숫자는 해당 직각 클리어 기록 개수입니다.

1. 상하위권 격차 + 환경 변수 영향력

200건 이상의 샘플을 가진 애들 가운데 워로드를 제외하고 최하위인 포식자와 최상위인 버스트의 조정 DPS는 약 1.245배 차이입니다. 이전 글에서 비교했던 강무/절정의 경우 버스트와 약 1.1 ~ 1.15배 정도의 격차인걸로 드러났습니다. 

구체적으로 보면 최하위 5개 각인(전태고기환류일격두동)과 최상위 5개 각인(그믐버스트만월충단오의) 정도가 약간 규격을 벗어난 수준으로 보입니다. 인간계 최상위 죽습과 인간계 최약체 포식 사이의 차이는 18%로 각인 한줄 정도의 격차이지만 신계 최상위 그믐/버스트와 환류의 차이는 38%로 그 두배가 됩니다.

환경 변수의 영향력 역시 이전 분석과 동일하게 유지된 모습입니다. 특히 버스트는 1관문 샘플이 많이 추가되고 보정도 들어가니까 순식간에 중위권으로 떨어질 정도고, 역천과 세맥/포강 등은 3관문에서는 중위권에 불과하지만 1관문에서는 최상위권으로 치고 올라옵니다. 

2. 직각 내부 분포 변화

지난 분석에서 중상위권에 있었던 피메와 광기는 인간계 최하위권으로 내려왔습니다. 이 부분은 피메/광기 유저들의 템렙이 상대적으로 높았던 것을 보정한 효과가 컸습니다. 

저번 데이터에서 충단, 강무, 일격 등 특화사멸들이 이상할 정도로 상하위 격차가 작게 나왔는데 템렙 보정하고 샘플 사이즈가 충분히 확보된 결과 어느 정도 안정적인 분포가 나온 모습입니다. 난무스커와 잔재블레 역시 템렙 보정 + 샘플 확대의 수혜를 크게 받았습니다(사실 이 두 클래스는 이전 분석에서도 중간값이 낮을지언정 분포 자체는 넓게 퍼져있었지요). 

3. 아웃라이어와 정규분포 문제

지난 분석 결과를 바탕으로 그래프의 특정 부분(e.g. 상위 25%)을 잘라서 재배열하고 활용하시는 분들이 있었는데요, 의미가 없는 해석은 아니지만 부정확한 추론으로 이어질 수 있는 위험이 있습니다. 특히 아직 충분히 많은 샘플이 확보되지 않은 직각이라면 더더욱 그렇습니다. 

이번에 샘플 크기를 확 키우면서 특정 직각의 순위가 확 바뀌기도 했지만 더 흥미로운 지점은 아웃라이어가 두드러지는 경우가 있다는겁니다. 예를 들어서 고기나 세맥 보면 최소 5개 이상의 최대치 이상 아웃라이어가 발견됩니다. 




세맥/고기처럼 아웃라이어 많은 직각들은 사실 분포 자체가 정규분포가 아니라 더 넓게 퍼져있을 가능성이 높습니다. 우측 아웃라이어가 많은 고기, 세맥은 실제로는 저보다 고점이 높다고 봐야 하고 좌측 아웃라이어가 많은 질풍은 저거보다 저점이 낮다고 보시는게 타당합니다.


<데이터 공유 및 출처 관련>

이번 데이터는 제가 사용한 로그 사이트에 3/11일 기준으로 올라온 모든 로그 데이터를 다 긁은 결과입니다. 새로 업로드된 것들이나 북미 최신밸패 이전 결과가 빠지긴 했지만 사이트 유저 자체가 확 늘어나고 신규 로그가 쌓이지 않는 이상 크게 달라질 일은 없을 것 같아요.

데이터 분석에 관심 있는 분들과 분석의 투명성을 담보하기 위해 그래프 뽑으면서 사용한 데이터를 그대로 공유합니다. API로 받은 1차 원본 json 파일은 닉네임이 포함되어 있어서 공개하기가 좀 어렵고요(닉네임 외에도 몇몇 개인화된 정보가 포함되어 있는데 다 지우기가 좀 귀찮음...), 제가 내놓은 분석 결과의 투명성을 담보하기 위한 차원이라 생각해 주세요. 

다만 데이터를 수집한 사이트의 주소를 공개할 생각은 없습니다. 이유는 크게 두가지인데요, 
- 개발자 포함해서 사이트 이용자들이 스마게가 알고 판교빔 날릴까봐 걱정하고 있습니다. 게다가 몇몇 용감한 친구들은 닉네임 안 가리고 로그를 업로드 해놨는데 이게 알려지면 그대로 TOS 위반으로 정지 사유가 될 수 있습니다.
- 원래 글섭 로그 데이터에 관심 갖고 있었거나 로스트아크 레딧 보는 분들이라면 굳이 제가 공유하지 않아도 다 알고 계실겁니다. 

데이터에 대한 분석 의도와 목적이 명확한 분들에 한해서만 쪽지 주시면 알려드릴게요.


<추후 분석 방향>

솔직히 한국 밸패 앞으로 당분간 없을거고 밸런스 자체에 대해서도 샘플이 확 늘어나지 않는 이상 더 얘기할만한 구석은 없을 듯 합니다. 상아탑 노말 기록도 수집해서 뽑아볼 생각은 있지만 하드보다 더 신뢰성 있는 결과가 나올 것 같지는 않고요. 따라서 앞으로는 밸런스 관련 정보는 추후에 신규 유저와 신규 데이터가 확보되어서 유의미한 변화가 나타났을 때에만 올리고, 미터기를 통해서만 알아낼 수 있는 구체적인 정보를 활용한 분석을 해볼까 합니다.

- 서폿 3종의 공증 스킬과 낙인, 아덴, 케어 가동률은 실전에서 얼마나 차이가 날까?
- 아드로핀 등 배틀아이템의 실전 딜 상승률은 얼마나 될까? 클래스마다 아드 효율이 얼마나 차이가 날까?
- 백어택 적중률 100% 찍는 버스트와 8초에 한번씩 사이클 굴리는 버스트 중에 누가 더 DPS가 높을까?
- 일격스커 방천격 트리는 정말 고점이 더 높을까?

등등 실전에서 검증 불가능한 여러 가설을 테스트해볼 수 있을겁니다. 이전 글에서도 말씀드렸듯 저는 데이터쟁이라서 데이터 갖고 노는걸 정말 좋아하지만 한국 로스트아크에서 미터기는 도입해봐야 득보다 실이 많을거라 생각합니다. 그래도 한국과는 다른 유저 문화와 환경을 갖고 있는 글섭에서 로그 정보를 공유받으며 간접적으로 영향을 주고받고 교류하는 것도 나름의 가치가 있다고 생각하며, 앞으로도 더 재미있는 데이터와 분석을 할 수 있기를 바랄 따름입니다.