
이번 대회 결과는 현지시간으로 지난 7일 미국 캘리포니아주 샌디에이고에서 열린 '뉴립스 2025 컨퍼런스'에서 최종 발표됐다.
김경중 지도교수와 석사과정 김경보, 권은주, 김유진, 박상연 학생 등 4명으로 꾸려진 GIST 연구팀은 '대전(배틀링) 트랙: 포켓몬 1세대 규칙 부문(Gen 1 OU)'에 출전해 2위를 기록했다.
해당 부문은 초기 151종의 포켓몬과 1세대 특유의 계산 방식 및 시스템적 허점(버그) 등을 반영한 규칙 안에서 AI가 전략을 겨루는 종목이다.
포케에이전트 챌린지는 포켓몬 게임의 배틀 환경을 구현해 AI 간 대결을 진행하는 국제 대회다. 참가한 AI 모델은 불확실한 상황에서 포켓몬 교체나 기술 사용 등을 스스로 판단해야 하며, 상대 전략 예측과 장기 계획 수립 등 종합적인 능력을 평가받는다.
GIST 연구팀은 제한된 데이터와 계산 자원이라는 제약 조건 속에서 AI 성능을 극대화하는 전략을 구사했다. 이들은 모델을 처음부터 학습시키는 대신 이미 기본 능력을 갖춘 모델에 필요한 부분만 추가 학습하는 '미세 조정(Fine-tuning)' 방식을 채택했다.
특히 연구팀은 학습 효율과 안정성을 높이기 위해 '크론(Kron) 옵티마이저' 기법을 도입했다. 이는 기존 1차 최적화 알고리즘과 달리 모델의 곡률 정보를 반영하는 2차 최적화 알고리즘으로, 제한된 환경에서 학습 속도를 높이는 데 효과적이다.
아울러 학습이 진행될수록 새로운 정보를 습득하지 못하는 '가소성 상실' 문제를 방지하고자 'AID(Activation by Interval-wise Dropout)' 기술을 적용해 모델의 학습 능력이 유지되도록 설계했다.
데이터 부족 문제는 자체 실험 환경 구축으로 해결했다. 연구팀은 대회 측이 제공한 19만 개의 기본 데이터만으로는 학습에 한계가 있다고 판단, 19종의 서로 다른 AI 모델이 반복 대결하는 '로컬 래더 셋업(Local Ladder Setup)' 환경을 조성했다. 이를 통해 약 135만 개의 고품질 데이터를 추가로 확보하며 모델의 전략적 완성도를 높였다.
GIST 측은 이번 성과가 데이터가 적거나 불확실성이 높은 환경에서도 강화학습이 효과적으로 작동할 수 있는 방법론을 제시했다는 점에서 의미가 있다고 설명했다.
김경중 지도교수는 "학생들이 한정된 자원 속에서도 창의적 전략과 치밀한 실험 설계를 바탕으로 국제적인 성과를 이뤄냈다"며 "GIST AI융합학과의 연구 역량이 세계적 수준임을 보여주는 결과"라고 평가했다.
팀을 이끈 김경보 학생은 "제한된 자원에서도 AI 모델을 효율적으로 최적화할 수 있는 기술적 가능성을 확인했다"며 "이번 기술을 실제 산업 문제 해결에도 적용할 수 있도록 연구를 이어가겠다"고 말했다.