자료제공 - 인텔
인텔의 주요 제품은 컴퓨터의 두뇌 역할을 하는 프로세서(CPU)이지만, 시스템 메모리(DRAM)는 성능 향상에 있어 매우 중요한 구성 요소다. 특히 서버에서는 처리 코어의 수가 메모리 대역폭의 증가 속도를 초과하면서 메모리가 성능에 중요한 영향을 미치고 있다.
기상 모델링, 전산 유체 역학(computational fluid dynamics) 및 특정 유형의 인공지능(AI)과 같은 고성능 컴퓨팅 작업에서 이러한 불균형은 병목 현상을 유발할 수 있다. 업계 파트너들과 수년간의 개발 끝에 인텔 엔지니어들은 업계에서 가장 빠른 시스템 메모리로 이 병목 현상을 해소할 수 있는 방법을 찾아냈다. 이 메모리는 새로운 개방형 산업 표준으로 자리 잡을 것으로 기대된다.
최근 출시된 인텔® 제온® 6(Intel® Xeon® 6) 데이터센터 프로세서는 새로운 메모리인 MRDIMM(Multiplexed Rank Dual Inline Memory Module)의 수혜를 처음으로 받아 더욱 향상된 성능을 제공할 수 있다.
인텔의 데이터 센터 및 AI(DCAI) 그룹 바누 자이스왈(Bhanu Jaiswal) 제온 제품 매니저는 "고성능 컴퓨팅 워크로드의 상당 부분이 메모리 대역폭에 의해 제한된 상황에서, MRDIMM은 이러한 작업에 가장 큰 혜택을 제공할 것"라고 설명했다.
시스템 메모리에 병렬성 도입
데이터센터 작업에 가장 많이 사용되는 메모리 모듈인 RDIMM은 최신 프로세서처럼 병렬 리소스를 탑재하고 있지만, 그런 방식으로 사용되지 않고 있었다.
인텔 DCAI의 조지 버기스(George Vergis) 메모리 경로 탐색 분야 선임 수석 엔지니어는 "대부분의 DIMM은 성능과 용량을 위해 두 개의 랭크를 가지고 있다."라며 "하나의 메모리 칩 세트는 한 랭크에 속하고, 나머지는 다른 랭크에 속한다. RDIMM에서는 데이터가 여러 랭크에 걸쳐 독립적으로 저장되고 접근될 수 있지만, 동시에 접근될 수는 없다. 이때문에 사용하지 않는 병렬 리소스를 합치면 어떨까"라는 생각에서 이를 개발하게 됐다고 설명했다.
이 아이디어는 DRAM 모듈에 작은 인터페이스 칩인 멀티플렉서(mux)를 추가하는 것으로, 이를 통해 데이터가 같은 시간 단위 내에서 두 랭크의 메모리를 가로질러 흐를 수 있다. mux 버퍼는 각 MRDIMM의 전기 부하를 통합하여 RDIMM에 비해 더 높은 속도로 작동할 수 있도록 하며, 두 랭크의 메모리가 병렬로 접근될 수 있으므로 대역폭이 두 배로 증가하게 된다.
그 결과, 몇 세대의 메모리 기술을 뛰어넘은 역대 가장 빠른 시스템 메모리를 개발할 수 있게 됐다. 이로 인해 최고 대역폭은 6,400 메가트랜스퍼/초(MT/s)에서 8,800 MT/s로 약 40% 상승했다.
동일한 표준 메모리 모듈로 더 빠른 속도 제공
인텔은 메모리 회사로 시작하여 EPROM과 DRAM을 포함한 여러 기술을 발명했으나 메모리 사업을 운영하지 않는다. 그러나 인텔은 여러 다른 컴퓨팅 부품들이 상호 운용 가능하고 더 높은 성능을 발휘하도록 돕는 노력은 계속해왔다.
조지 버기스 선임 수석 엔지니어는 마이크로 전자 산업의 개방형 표준을 설정하는 기구이자 메모리 표준을 주로 다루고 있는 국제반도체표준협의기구(JEDEC)에서 인텔을 대표하고 있으며, 2018년에 DDR5 표준에 기여한 작업으로 JEDEC상을 수상한 바 있으며 현재 DDR6 작업에 전념하고 있다. 버기스는 동료들과 함께 2018년에 이 작업을 시작하고, 2021년에는 프로토타입을 통해 개념을 입증했다. 인텔은 메모리 생태계와 협력하여 첫 번째 부품을 개발하고, 2022년 말에는 이를 JEDEC에 새로운 개방형 표준으로 제공한 바 있다.
MRDIMM의 특징은 그 사용 편의성이다. MRDIMM은 일반 RDIMM과 동일한 커넥터와 폼 팩터를 사용하며, 심지어 작은 mux 칩도 모듈의 이전 자리와 호환되므로, 메인보드에서 변경이 필요하지 않다. 또한 MRDIMM은 RDIMM과 동일한 오류 수정 및 안정성, 가용성 및 서비스 가능성(RAS) 기능을 모두 제공하며, 데이터 버퍼에서 개별 요청이 아무리 많이 발생하더라도 데이터 무결성이 유지될 수 있다. 따라서 데이터센터 고객은 새 서버를 주문할 때 MRDIMM을 선택하거나, 나중에 해당 서버를 랙에서 빼고 RDIMM을 새 MRDIMM으로 교체할 수 있으며, 새로운 성능을 위해 코드를 변경할 필요도 없다.
제온 6와 MRDIMM
MRDIMM을 지원하는 첫 번째 프로세서는 올해 출시된 인텔 제온 6 프로세서(코드명 그래나잇 래피즈)로, 최근 독립적인 테스트에서 동일한 제온 6 시스템을 MRDIMM 및 RDIMM을 장착해서 두 대를 비교한 결과 MRDIMM을 장착한 시스템이 작업을 최대 33% 더 빠르게 완료했다.
자이스왈 제온 제품 매니저는 "MRDIMM이 제공하는 대역폭의 개선은 소규모 언어 모델과 기존 딥러닝 및 추천 시스템 유형의 AI 워크로드에 매우 적합하며, 이는 제온에서 쉽게 실행할 수 있고 MRDIMM으로 성능을 상당히 향상할 수 있다."고 밝혔다.
선도적인 메모리 공급업체들이 MRDIMM을 출시했으며, 다른 업체들도 추가로 출시할 것으로 예상된다. 미국 국립 양자과학기술원, 국가 핵융합연구소 등 고성능 컴퓨팅 연구소들은 MRDIMM을 지원하는 제온6 P-코어 모델을 적극적으로 채택하고 있으며, NEC와 같은 OEM들이 이를 지원하고 있다.