엔비디아(NVIDIA)가 RTX PC와 DGX 스파크(DGX Spark) 시스템에서 누스 리서치(Nous Research)의 차세대 로컬 AI 에이전트 '헤르메스(Hermes)'를 공식 지원한다고 밝혔다. 이번 지원을 통해 사용자들은 특정 모델이나 공급업체에 종속되지 않고 24시간 상시 가동되는 강력한 로컬 AI 환경을 구축할 수 있게 됐다.

자체 진화하는 AI 에이전트 '헤르메스', 엔비디아 DGX 스파크에서 상시 가동
엔비디아에서 제시하는 AI 에이전트, '헤르메스' ©엔비디아

엔비디아가 자사의 RTX PC 및 DGX 스파크(DGX Spark) 하드웨어에서 누스 리서치(Nous Research)의 AI 에이전트 '헤르메스(Hermes)'를 로컬 환경으로 지원한다.

최근 공개된 헤르메스는 출시 3개월 만에 깃허브(GitHub) 스타 14만 개를 돌파했으며, 글로벌 플랫폼 오픈라우터(OpenRouter) 기준 전 세계에서 가장 많이 사용되는 에이전트로 기록됐다. 누스 리서치가 개발한 이 에이전트는 특정 공급업체나 모델에 종속되지 않으며, 로컬 환경에서 24시간 상시 가동되도록 설계되었다. 또한, 메시징 앱 연동 및 로컬 파일 접근이 가능하다.

헤르메스의 주요 경쟁력은 크게 네 가지로 요약된다:

첫째, 복잡한 작업을 수행하며 새로운 기술을 자체적으로 생성하고 개선하는 '자체 진화 기술'을 갖췄다. 둘째, 특정 하위 작업만 수행하는 '독립형 서브 에이전트'를 운영해 작업의 혼란을 최소화하고 더 작은 컨텍스트 윈도우에서도 실행할 수 있도록 돕는다.

셋째, 모든 도구와 플러그인에 대한 스트레스 테스트를 거쳐 300억 파라미터급 로컬 모델 환경에서도 디버깅 없이 안정적으로 작동한다. 넷째, 단순히 얇은 래퍼(wrapper)가 아닌 능동형 오케스트레이션 계층으로 작동해 동일 모델 기준 타 프레임워크 대비 일관되게 우수한 성능을 제공한다.

이러한 에이전틱 워크플로우를 하루 종일 지속하기 위해 설계된 시스템이 엔비디아 DGX 스파크다. 128GB 통합 메모리와 1페타플롭급 AI 성능을 제공하여 1,200억 파라미터 규모의 전문가형 혼합(MoE) 모델을 상시 실행할 수 있다. 사용자는 라마.cpp, LM 스튜디오(LM Studio), 올라마(Ollama) 등을 활용해 헤르메스 깃허브 저장소에서 로컬 에이전트를 손쉽게 연동 및 구축할 수 있다.

한편, 엔비디아는 RTX AI PC 생태계 확장을 위한 추가 업데이트도 발표했다. 구글(Google) 젬마 4(Gemma 4) 모델의 NVFP4 체크포인트를 제공해 블랙웰(Blackwell) GPU에서 최대 3배 빠른 추론 속도를 지원하며 , 미스트랄 미디엄(Mistral Medium) 3.5 버전의 호환성을 업데이트했다. 또한, 윈도우 환경(WSL2)을 지원하여 오픈클로(OpenClaw) 환경을 최적화하는 오픈소스 스택 '네모클로(NemoClaw)'를 새롭게 공개했다.