비교하고자 하는 건 인간의 본능과도 같다. 어떤 게 더 빠른지, 더 강한지, 그리고 더 뛰어난지 인간은 항상 이를 비교해 왔다. 이는 최근 몇 년 사이 전 세계적인 화제를 불러일으킨 AI도 마찬가지다. 현존하는 AI 가운데 가장 뛰어난 AI는 어떤 AI일까. AI의 점수를 매기기 위한 정확한 기준이 확립되지 않은 만큼, 아직 이에 대해 얘기하기엔 이르지만, 적어도 게임에 한해서는 답이 나온 것 같다.
북미 현지 시각으로 3월 23일, 미국 캘리포니아 샌프란시스코에서는 미스트랄 AI, 서리브럴 밸리(Cerebral Valley), 쉑15(Shack15)가 공동 주최한 '미스트랄 AI 해커톤'이 개최됐다. 다양한 프로그램이 진행된 가운데 특히 눈길을 끌었던 건 바로 SF3 LLM 콜로세움이다. 스트리트 파이터3를 활용해 LLM(Large Language Models, 대규모 언어 모델) AI들이 맞붙은 것으로 8개의 LLM AI들이 맞붙은 결과 오픈 AI의 'GPT 3.5 터보'가 우승을 차지했다.
LLM은 방대한 양의 자연어 처리 작업을 수행할 수 있는 딥러닝 알고리즘을 뜻한다. 이번 SF3 LLM 콜로세움에 참가한 8개의 LLM AI들에게는 '스트리트 파이터3'와 관련된 다양한 정보들이 텍스트 형태로 제공되었으며, 이를 LLM AI들이 학습하고 상황에 따라 어떻게 대처하는지 파악하는 식으로 진행됐다. 동일한 조건을 위해 캐릭터는 켄으로만 제한됐으며, 공개된 영상에서는 단순히 펀치와 킥을 날리는 데에서 그치지 않고 파동권이나 승룡권 등의 기술을 구사하는 것도 엿볼 수 있다.
SF3 LLM 콜로세움에 참가한 LLM AI는 오픈 AI의 GPT 3.5 터보, GPT 4(일반, 1106, 0125), GPT 터보 5개와 미스트랄 AI의 미스트랄 스몰, 미스트랄 미디움, 미스트랄 라지 3개로 342경기를 진행한 결과 GPT 3.5 터보가 1776점으로 1위를 차지했다. 이어 미스트랄 스몰 최신 버전이 1586점으로 2위에 올랐으며, GPT 4 1106 프리뷰 버전, GPT 4, GPT 4 터보, GPT 4 0125 프리뷰 버전이 3~6위를 차지했다. 한편, 미스트랄 AI의 미스트랄 미디움과 라지 모델은 7위, 8위에 그쳤다.
한편, 상대적으로 성능이 더 뛰어난 것으로 알려진 GPT 4, 미스트랄 미디움과 라지 모델이 아닌 GPT 3.5 터보와 미스트랄 스몰 최신 버전이 상위권에 오른 이유에 대해 미스트랄 AI 운영진은 "소형 모델이 지연 시간과 속도 면에서 이점이 있다"면서 빠른 반응 속도가 이점으로 작용했다고 설명했다.
해당 프로젝트의 소스 코드는 미스트랄 AI가 깃허브를 통해 공개했으며, 누구나 시도해 볼 수 있다.
인벤 주요 뉴스
▶ [뉴스] 엔씨노조 "분사 계획 철회하라"...집단행동 예고 [2] | 이두현 (Biit@inven.co.kr) | 06-05 |
▶ [뉴스] 펄어비스, 검은사막 '中 판호' 받았다 [9] | 이두현 (Biit@inven.co.kr) | 06-05 |
▶ [뉴스] 5월 스팀덱에서 가장 많이 플레이한 게임은 '하데스2' [0] | 윤홍만 (Nowl@inven.co.kr) | 06-05 |
▶ [뉴스] 2분 만에 매진된 '마비노기' 행사 입장권, 추가 판매한.. [0] | 김규만 (Frann@inven.co.kr) | 06-05 |
▶ [뉴스] 큰 거 온다, '엘든링' DLC 패키지 예판 7일 시작 [0] | 김규만 (Frann@inven.co.kr) | 06-05 |
▶ [인터뷰] 카카오게임즈 노조의 시발점, '1인당 생산성' [1] | 이두현 (Biit@inven.co.kr) | 06-05 |
▶ [뉴스] 크래프톤, 신작 라인업에 '왈츠 앤 잼' 추가 [4] | 정재훈 (Laffa@inven.co.kr) | 06-05 |
▶ [프리뷰] 캐릭터는 OK, 선택과 집중이 필요한 '세컨드 웨이브' [3] | 윤서호 (Ruudi@inven.co.kr) | 06-05 |
▶ [뉴스] 데스티니 가디언즈 '최후의 형체', 글로벌 정식 출시 [0] | 김규만 (Frann@inven.co.kr) | 06-05 |
▶ [뉴스] 아이언메이스, '다크 앤 다커' 무료 플레이 서비스 시.. [10] | 김규만 (Frann@inven.co.kr) | 06-05 |
▶ [뉴스] 국내 정식 지원! GTA 공인 모드 플랫폼 'FiveM' [5] | 김규만 (Frann@inven.co.kr) | 06-05 |
▶ [프리뷰] DLC도 GOTY급? 엘든 링: 황금 나무의 그림자 [10] | 윤홍만 (Nowl@inven.co.kr) | 06-04 |
▶ [뉴스] 게임 개발을 여행하는 시나리오 기획자를 위한 안내서 [0] | 강승진 (Looa@inven.co.kr) | 06-04 |
▶ [동영상] 베놈은 어떻게 영웅이 되나 '베놈: 라스트 댄스' [0] | 강승진 (Looa@inven.co.kr) | 06-04 |
▶ [뉴스] 네오플 "노조의 결렬 발표, 게임 운영엔 차질 없도록" [7] | 이두현 (Biit@inven.co.kr) | 06-04 |