ABSTRACT
  무릉도장 상위랭커 3000명의 데이터를 회귀분석하여 변수 중요도(Feature Importance)를 확인 해 본 결과 유저들의 스펙 중 무릉도장에서 영향력이 높은 10개 요소는 
  (공격력, 마력) > 레벨 > 최종 데미지 > 주스탯 > 보공 > 데미지 > 재사용(초) > 방무 > 크뎀 > 공격 속도 이다.
전투력에 포함되지 않는 요소들 중 상위 5개 변수는 
  레벨 > 재사용 대기시간 감소 (초) > 방어력 무시 > 버프 지속시간 > 재사용 대기시간 감소(%) 이다.


INTRODUCTION

 메이플스토리 무릉도장 컨텐츠는 2008년 출시 된 이후 다양한 변화를 거쳐 제한된 시간 내에 높은 층을 달성하는 경쟁 컨텐츠의 역할과 유저들 사이 보스컨텐츠 파티 모집 및 보스 솔로 플레이 시 클리어 가능성 여부를 측정하는 보조지표로서 활용되고 있습니다. 

 현재 무릉도장 컨텐츠와 관련된 검색결과를 살펴 보았을 때 경쟁 컨텐츠로서의 기능보다는 보조지표로 유저들 간의 보스 파티를 구인/구직하기 위한 도구로 활용하는 경우가 많은 상황입니다. 이번 패치로 전투력 지표가 도입되어 유저간 스펙을 알아 볼 수 있지만 몇몇 전투력 계산에 반영되지 않는 요소와 각 직업별 표기되는 전투력의 차이로 인해 유저간 전투력 표기수치가 보스에서 발휘 될 전투력과 동일할 것이라 간주하기에는 무리가 있는 상황입니다. 

  이에 여전히 무릉도장의 층수 기록이 특정 보스를 클리어 할 수 있을지에 대한 보조지표로 활용 될 수 있다고 보여집니다. 인벤의 '쿠제스' 유저분이 제작해주신 '환산 주스탯' 시트를 활용하여 환산 주스탯을 활용하여 유저의 무릉도장 도장 층수 여부 예측 할 수 있었지만, 유저의 어떠한 요소가 예측된 층수에 도달 할 수 있었는지 여부와 무릉도장 컨텐츠 숙련도에 예측 층수의 차이가 있었습니다.

 본 글에서는 무릉도장 상위 유저 데이터를 활용하여 스펙 중 어느 요소가 무릉도장 컨텐츠에 중요하게 작용하는지 회귀분석을 이용하여 평가하는 것을 목표로 합니다. 


Meothods
  1. 데이터 선정
      최근 오픈된 Maple API를 활용하여 2023-12-22일자의 무릉도장 랭킹 상위 3000명의 데이터를 사용합니다.
      (캐릭터식별자(ocid)조회불가 2명 및 종합 능력치 조회 불가 19명 누락, 최종 2981명)

  2. 변수 선정
      'character_level', '데미지', '보스 몬스터 데미지', '최종 데미지', '방어율 무시', '크리티컬 확률', '크리티컬 데미지', '상태이상 내성', '버프 지속시간', '공격 속도', '재사용 대기시간 감소 (초)', '재사용 대기시간 감소 (%)', '재사용 대기시간 미적용', '속성 내성 무시', '상태이상 추가 데미지', '무기 숙련도', '공격력', '마력', '소환수 지속시간 증가', 'main_stat' 총 20개를 사용합니다. 

** 'main_stat' 변수는 'STR'', 'DEX', 'INT', 'LUK' 중 수치가 가장 높은 값을 참조하고 '제논'의 경우 ('STR', 'DEX', 'LUK') * 0.7을, 데몬어벤져의 경우 'HP'를 참조하게 하였습니다. (2023-12-22 기준 데몬어벤져 상위 3000명에 미존재)

  3. 타겟값 선정
    타겟값은 무릉도장 층수와 해당 층수 클리어 시간을 바탕으로 다음과 같이 재구성하였습니다.

(좌측 : 기존 무릉도장 층수만 사용했을 때, 우측 : 무릉도장 층수와 클리어시간을 반영하여 설정하였을 때)

** 우측 60, 70, 80층에서 짧은 클리어 타임으로 인해 Total dealt 가 좌측에 비해 많이 쌓여 있음을 확인가능 -> 특정 층수에 주차를 해둔 것이 아닌가 추측

  4. 회귀 모델 개발
      회귀분석에는 LightGBM을 사용하였으며 사용된 파라미터는 다음과 같습니다. 모든 입력 및 출력은 각각 StandardScaler를 적용한 후 수행하였습니다.

params = { 'objective': 'regression',  # 회귀 모델 
                    'metric': 'mse',  # 평가 지표: Mean Squared Error 
                    'boosting_type': 'gbdt',  # Gradient Boosting Decision Tree 
                    'num_leaves': 30,  # 나무의 최대 리프 노드 수 
                    'learning_rate': 0.001,  # 학습률 
                    'feature_fraction': 0.9,  # 각 트리마다 사용할 피처의 비율 
                    'random_state' : 1222 }

num_round = 10000  # 트리의 개수


Results and Discussion
회귀 분석 결과
(2949 Early Stopping, Mean Squared Error: 0.3429582899797355)
R-Squared : 0.7812134064725528


Total dealt 를 무릉도장 층수로 변환한 도표(회색 선 : y=x, 초록색 영역 : 실제 층수와 +-3 영역)


Feature Importance (Gain)


회귀분석 수행 후 Feature Importance를 확인 해 본 결과 
공격력', '마력', 'character_level(이하 캐릭터 레벨)', '최종 데미지', 'main_stat(이하 주스탯)', '보스 몬스터 데미지', '데미지', '재사용 대기시간 감소 (초)', '방어율 무시', '크리티컬 데미지', '공격 속도', '버프 지속시간', '상태이상 내성', '크리티컬 확률', '재사용 대기시간 감소 (%)', '상태이상 추가 데미지', '재사용 대기시간 미적용', '소환수 지속시간 증가', '무기 숙련도', '속성 내성 무시'
순서로 나타났다.

전투력에 포함되는 요소의 상위 5개의 Importance 는
(공격력, 마력) > 최종데미지 > 주스탯 > 보스 몬스터 데미지 > 데미지 순으로 나타났다.

전투력에 포함되지 않는 요소의 경우
캐릭터 레벨 > 재사용 대기시간 감소 (초) > 방어력 무시 > 버프 지속시간 > 재사용 대기시간 감소(%) 순으로 나타났다.

일반적으로 유저들 사이에서 어빌리티에서 선호되는 상태이상 추가 데미지의 경우 전체 Importance의 1.433%로 낮은 수준으로 나타났다.
한계점
  2023-12-22 자료 기준 무릉도장 랭커들의 캐릭터 정보가 무릉도장 기록 달성 시 장착했던 아이템 세팅이 아닐 확률이 존재
  무릉도장 81층 이후 유저의 데이터가 상대적으로 부족하여 높은 층수를 달성 한 유저의 예측 결과가 불확실