안녕하세요. 북미 로그 데이터 수집해서 분석해서 소개하는 글을 올렸던 언젠가이발관이라고 합니다. 이번에 이슈가 된 북미 그래프 번역글(https://www.inven.co.kr/board/lostark/4811/8847771) 에 대해 원작자들이 우려를 표명한 내용이 있어 전달하고자 글 씁니다. 

결론부터 말씀드리자면 북미 미터기 지표 원작자들은 지금 인벤에서 미터기 지표를 해석하고 받아들이는 방식에는 상당한 문제가 있다고 보고 있습니다.


인벤에 공유된 레이드별 DPS 기초 지표 사이트입니다

레이드별 조건 필터 달아서 검색할 수 있는 사이트입니다

제가 북미 미터기 개발 디스코드에 몇몇 분석 결과를 공유한 이후 베히모스와 더퍼스트 헬퍼 다니느라 바빠서 잠시 손을 뗐었는데요, 그 사이 분석 작업을 주도적으로 진행한게 디스코드 닉네임 kennethnyu, PoisonSandwich 두 유저입니다. 

저는 상아탑 1, 3관문에 대해서만 데이터를 뽑아서 분석했다면 kenneth는 범위를 크게 넓혀서 여러 레이드 지표를 뽑아냈고 Sandwich의 경우 아예 직접 조건을 걸어서 데이터를 검색할 수 있는 BI툴까지 만들어놓은 상태인데요, 이번에 이슈가 된 지표는 위 링크 가운데 kennethnyu의 사이트 내용을 캡처해서 한국어 태그를 붙인 버전입니다. 

문제는 해당 지표와 현재 북미 미터기 데이터셋에 몇몇 불완전한 부분과 보완할 부분들이 있다는 점인데요, PoisonSandwich가 디스코드에 작성한 코멘트를 이번 인벤 게시글 관련해서 대화 나눈 맥락을 반영해서 번역해 봤습니다.
(제 해석이 반영되지 않은 직역 보시려면 Glycogen님 코멘트 참고하시면 됩니다)

Can you go to inven because you posted this <https://www.inven.co.kr/board/lostark/4811/8847771>  and explain that there are things that are a work in progress in our graphs. 

First, communication overflow(교감) for what you posted was misclassified and we will still have misclassification errors until we redo the work with tripod updates. There could be other ones potentially misclassified as well so this is not accurately representing the typical experience of these raids as of now. this will be fixed later for all of our graphs

Second, there are important interactions that are not being completely shown like gunlance with directional attackers(사멸) bonus helping slayers, surge, and other entropies(사멸) in all of the different raids there are a good amount of non entropy who benefit from gunlance(워로드) in different raids. you can go to my website and look into this yourself (click my profile, page 3 and 7), but there is a slight misrepresentation there too. Bards(바드) are also involved in most of the max logs for all classes which couldnt be displayed in your post.

Third, Access to gem information is not available to us so gargadeth is a nightmare between poorly geared alts to mains. Elixir (엘릭서) information is also most likely not included in these graphs. We can access master, but will have to see about critical. probably not included in any of our graphs.

Fourth, gargadeth(가르가디스) is a problem for logs because people are not killing it normally but are fighting it in a way to get high records (wait for the boss to do give the damage buff then burst it down) so you have a mix of proper fights and improper fights.

can you also put this link for Kennth's site <https://kennethnyu.github.io/dps_charts_sorted_by_q75.html> because it is being updated and explain its good for a good overview of 북미 로아 logs. if you want to add my site its for very detailed information.


첫째, 서머너의 경우 상소를 교감으로 잘못 분류한 케이스가 섞여 있습니다. 스킬 트라이포드에 대한 정확한 로그 데이터가 들어오면 수정될 예정입니다. 

둘째, 상아탑 데이터는 파티 시너지 변수를 고려하지 않고 있습니다. Sandwich가 만든 BI 사이트에서 데이터를 찍어보면 특히 레이드 환경에 따라 워로드와 사멸 직업군 사이의 시너지가 상당한데, 인벤에 소개된 그래프에선 이 부분에 대한 보정이 전혀 없는 상태입니다. 마찬가지로 특화 바드를 활용해서 딜찍해서 DPS를 확 뻥튀기한 데이터도 최대값에 상당부분 포함되어 있는데, 이런 부분에 대한 보정 역시 부족합니다. 

 셋째, 미터기 데이터에는 현재 보석에 대한 정보가 없기 때문에 보석 제대로 맞춘 본캐와 7렙둘둘한 부캐들을 구분할 수 있는 변별력이 없습니다. 이 문제는 가르가디스 데이터에서 특히 심각합니다. 엘릭서 역시 달인을 제외하고는 식별할 방법이 없는데 인벤에 공유된 그래프에서는 엘릭서 변수에 대한 보정치 역시 포함되어 있지 않습니다. 

 넷째, 가르가디스의 경우 위의 문제뿐만 아니라 비정상적으로 DPS를 뻥튀기하는 트릭을 써서 죽인 케이스가 섞여 있어서 더더욱 부정확합니다. 공격력 버프가 들어올 때까지 미터기 켜지 않고 존버하다가 버프 들어온 다음 버스트딜로 컷하는 왜곡된 데이터가 정상 데이터에 섞여들어가 있습니다.  

다른 원작자인 kenneth도 미터기 데이터를 가지고 약코니 뭐니 하면서 갈드컵 열고 특정 직업 비하하는 짓좀 하지 말라고 하고요.


근본적으로 여러분께 두 가지 부탁을 드리고 싶은데요,

1) 지표와 데이터는 언제나 컨텍스트를 고려해야 합니다. 샘플 사이즈와 레이드의 환경 변수는 정말 중요합니다. 북미 기준 엔드컨텐츠가 상아탑 하드이긴 하지만 3관문 기준 50% 가까운 유저들은 5분컷을 내고 있는걸로 나타납니다. 비슷한 맥락에서 라자람은 내부 들어가는 딜러가 큰 어드밴티지를 가지며 라카이서스는 말할 필요도 없는데 여기서 나온 데이터를 그대로 한섭 실정에 적용할수는 없습니다. 템렙과 보석 팔찌 효과를 100% 보정할 수 없다는 부분도 함께 감안하셔야 합니다.

2) 북미 데이터 분석은 아직도 진행중입니다. 위에 언급한 템렙 및 스펙 보정과 시너지 문제의 경우에도 그렇고 데이터의 정규분포성 관련된 문제도 그렇고 연구하고 보완해야 할 부분이 많이 남아있습니다. 그런 통계적인 보정 처리가 제대로 이루어지지 않은 raw data를 가져다가 비전공자가 제멋대로 가공하고 해석하기 시작하면 오히려 통계가 없는 것만도 못한 상황이 발생할 수 있습니다. 어떤 종류의 보정 방법론을 적용할지는 사람마다 입장이 다르겠습니다만, 직각별 DPS 데이터를 뽑았는데 DPS가 아니라 제멋대로 '순위 평균값'을 뽑아서 나열하고 이러는거 통계적으로는 그냥 <틀린> 방법입니다. 제대로 된 결론이 나오기 전까지는 참고 자료로만 사용해 주시는게 안전합니다. 


그냥 단편적으로 'XX 직업이 K등이다'는 단편적인 숫자만 가져가서는 제멋대로 자르고 가공하는 것이 아니라 통계에 대해서 주체적으로 생각하고 해석하는 관점을 가지고 접근하셨으면 좋겠습니다.

추후 여유가 될 때 워로드의 파티 기여도, 서포터 데이터 등에 대한 분석 가지고 찾아오겠습니다. 감사합니다.