자료제공 - AMD


AMD가 슈퍼컴퓨팅을 위한 최고의 연례 행사인 슈퍼컴퓨팅 2019(SC 19)에서 전 세계 최상위 연구 시스템과 다수의 새로운 플랫폼에 AMD EPYC™ 프로세서 및 라데온 인스팅트™(Radeon Instinct™) 가속 카드를 지원하게 됐다고 밝히며 고성능 컴퓨팅(HPC)에서의 리더십 확장을 발표했다. 더불어, AMD는 새롭게 공개한 ROCm 3.0을 통해 새로운 컴파일러 및 HPC 애플리케이션을 지원하게 됐다.

AMD 수석 부사장 겸 최고기술책임자(CTO) 마크 페이퍼마스터(Mark Papermaster)는 “AMD는 2021년 출시되는 세계 최고 성능의 프론티어(Frontier) 슈퍼컴퓨터에 탑재될 프로세서 공급자로서 SC19에 참여하게 됐다”며, “이번 행사에 참가자들은 한 주 동안 엑사스케일(exascale)급 시스템의 기반이 될 AMD 기술을 경험할 수 있다. 또한, 이번 SC 19 현장에서 고성능 AMD EPYC CPU와 라데온 인스팅트 GPU가 함께 최고의 속도에서 구동되는 것부터 AMD 오픈 소프트웨어 생태계까지 모두 공개될 예정이다”라고 전했다.

페이퍼마스터 수석 부사장은 이번 행사에서 크레이(Cray), CERN(유럽입자물리연구소) 및 자일링스(Xilinx)와 함께 패널로 나서 하드웨어, 소프트웨어 및 프로그래밍 툴을 아우르는 새로운 기술적 돌파구를 포함하여 엑사스케일 시스템만의 혁신에 대해 논의할 예정이다.


■ 컴퓨팅에 최적화된 새로운 아마존 EC2 인스턴스에 2세대 AMD EPYC 탑재

아마존웹서비스(AWS)는 곧 출시 예정인 두 개의 아마존 엘라스틱 컴퓨트 클라우드 (Amazon EC2) 인스턴스를 공개하며 AMD EPYC 프로세서 도입을 확대한다고 발표했다. 새로운 인스턴스인 C5a와 C5ad는 2세대 AMD EPYC 프로세서를 탑재해 최대 3.3Ghz 속도로 구동된다. 또한, 두 인스턴스는 최대 96 vCPU와 함께 여덟 개의 가상화된 크기로 제공되어 고객이 일괄 처리, 분산 애널리틱스, 웹 애플리케이션을 비롯한 다양한 컴퓨팅 워크로드에 대한 비용과 성능 모두 최적화할 수 있도록 추가적인 선택권을 제공한다. 더불어, 두 인스턴스 모두 베어 메탈(bare metal)로 구성되어 고객이 기본 서버의 프로세서 및 메모리 리소스에 직접 액세스 가능한 애플리케이션을 실행할 수 있도록 지원한다. 이번 인스턴스는 192개의 로지컬 프로세서와 96개의 물리적 코어로 이루어져 컴퓨팅에 최적화된 EC2 인스턴스 제품군 중 가장 큰 인스턴스 대비 두 배 더 크다. C5a 및 C5ad 베어 메탈 인스턴스는 100 Gbps의 네트워크 대역폭을 활용할 수 있고 인스턴스용 저지연 네트워크 어댑터인 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter)와 호환되어 고객이 고성능 컴퓨팅 및 기타 대용량 워크로드를 확장할 수 있도록 지원한다. 이러한 새로운 인스턴스는 여러 AWS 리전에 출시될 예정이다.


■ AMD EPYC 슈퍼컴퓨터 지원 확장 통해 세계 최고 슈퍼컴퓨터 톱500 진입

HPC 기관들은 더욱 강력하고 효율적인 슈퍼컴퓨팅 시스템을 위해 지속적으로 2세대 AMD EPYC 프로세서와 라데온 인스팅트 가속 카드를 채택하고 있다. 2세대 EPYC 프로세서는 경쟁 솔루션 대비 두 배 높은 제조 애플리케이션 성능과 최대 60% 빠른 생명 과학 시뮬레이션 성능을 제공한다. 또한, 라데온 인스팅트 GPU 가속 카드는 HPC 워크로드에서 이론적으로 최대 6.6 TFLOPS 더블 프리시전(Double Precision) 성능을 제공한다. 더불어, 두 제품은 PCIe® 4.0을 지원해 이기종 시스템 전반에서 더 빠른 컴퓨팅을 위한 고대역폭을 제공한다.

AMD 프로세서 및 가속 카드를 도입한 최신 고객은 아래를 포함한다.

디지털 트랜스포메이션 전문 기업 아토스(ATOS)는 2세대 EPYC 프로세서 기반 두 대의 불세쿼나(BullSequana) XH2000 슈퍼컴퓨터를 일기 예보와 대기학, 해양학, 기후 과학에 대한 연구를 진행하는 메테오-프랑스(Météo-France)에 공급한다.

아토스와 프랑스 국가 고성능 컴퓨팅 기관인 GENCI(Grand Équipement National de Calcul Intensif)는 CEA 팀이 운영하고 있는 TGCC 컴퓨팅 센터에 위치한 줄리오-퀴리(Joliot-Curie) 슈퍼컴퓨터에 아토스의 불세쿼나 XH2000 솔루션과 2세대 EPYC을 탑재했다.

줄리오-퀴리 슈퍼컴퓨터는 세계 최고 슈퍼컴퓨터 톱500의 54번째 에디션에 추가되었으며, 64코어 280W의 AMD EPYC 7H12가 탑재된 슈퍼컴퓨터 중 최초로 글로벌 랭킹에 올랐다.

HPE의 크레이(Cray)는 2세대 AMD EPYC프로세서를 탑재하고 샤스타™(Shasta™) 슈퍼컴퓨터 아키텍처를 기반으로 한 두 대의 새로운 슈퍼컴퓨터 ARCHER2와 Vulcan을 공개했다.

델 테크놀로지스(Dell Technologies)는 샌디에이고 슈퍼컴퓨터 센터(San Diego Supercomputer Center)의 익스팬스(Expanse) 슈퍼컴퓨터에 2세대 EPYC 프로세서가 탑재된 델 EMC 파워엣지(PowerEdge) 서버를 공급한다.

취리히 공대(ETH Zurich)는 오일러 VI(Euler VI) 시스템에 AMD EPYC 7742 프로세서를 탑재했다.
NEC는 독일 기상청(Deutscher Wetterdienst)에 NEC SX-Aurora TSUBASA 벡터 엔진과 함께 2세대 EPYC 프로세서가 탑재된 시스템을 제공한다.

취리히 공대의 과학 IT 서비스(scientific IT services) 부문 크리스찬 볼리거(Christian Bolliger)는 AMD EPYC 7742프로세서를 선택한 이유에 대해 “우리 연구원들이 일반적으로 사용하는 소프트웨어 애플리케이션의 대부분을 폭넓게 지원할 뿐만 아니라 성능, 우수한 메모리, I/O 대역폭과 함께 연구원들의 요구를 충족하는 가성비를 제공하기 때문”이라고 말했다. 그는 또한, “2세대 AMD EPYC 프로세서 기반의 오일러 VI 시스템을 통해 우리 고객들은 연구를 진전시키는 데 필요한 기능을 제공하는 시스템을 활용할 수 있게 되었다”고 말했다.


■ AMD EPYC으로 슈퍼컴퓨팅을 클라우드로 확장

HPC 산업은 새로운 워크로드, 더 높은 성능에 대한 요구, 그리고 더욱 손쉬운 장기적 또는 단기적 사용을 지원하도록 변화하고 있다. 이러한 변화는 클라우드를 통해 실행되고 있으며, 이는 사용자가 사내 장비로 구현할 수 있었던 것과 비교하여 더 낮은 비용으로 동일한 성능을 제공한다.

마이크로소프트 애저(Azure)는 1세대 AMD EPYC 프로세서 기반 시스템에서 실행되는 애저 HB 클라우드 인스턴스를 활용하여 과거 달성할 수 없었던 수준의 컴퓨터 유체 역학(CFD) 성능을 발표했다.

애저는 고성능 컴퓨팅을 위한 애저 HBv2 가상 머신(Azure HBv2 virtual machines)를 소개하며 클라우드에서 HPC의 경계를 더욱 확장시켜나가고 있다. AMD EPYC 7742 프로세서를 기반으로 한 이 가상 머신은 클라우드를 통해 쉽고 간편하게 2000Gbps HDR 인피니밴드(InfiniBand)와 단일 워크로드에 최대 8만 개의 코어를 지원하여 슈퍼컴퓨터 성능에 대한 액세스를 고객에게 제공한다.


■ ROCm 3.0 공개

프리-엑사스케일(pre-exascale) 소프트웨어 생태계에 대한 커뮤니티의 지원은 계속되고 있으며, 이러한 생태계는 AMD가 제공하는 GPU 컴퓨팅을 위한 기본 오픈 소스 구성 요소인 ROCm 을 기반으로 구축되었다. ROCm 개발 사이클은 매달 개발자에게 지속적으로 컴파일러(compiler), 라이브러리(library), 프로파일러(profiler), 디버거(debugger) 및 시스템 관리 도구(system management tools)에 대한 개선사항과 업데이트를 제공한다.

ROCm 3.0 개발과 관련하여 SC19에서 발표될 내용은 다음과 같다.

HIP-클랭(HIP-clang)을 혁신적으로 지원하기 위한 ROCm 3.0 소개 – LLVM을 기반으로 구축된 컴파일러, hipify-클랭(hipify-clang)을 갖춘 향상된 CUDA 변환 능력, PC와 ML을 위한 라이브러리 최적화
텐서플로우(TensorFlow), 파이토치(PyTorch) 등 강화 학습, 자율 주행, 이미지 및 비디오 감지 등의 응용 분야를 위한 선도적인 기계학습 프레임워크로의 ROCm 통합

OpenMP 프로그래밍, LAMMPS 및 NAMD와 같은 HPC 프로그래밍 모델 및 애플리케이션에 대한 확장된 가속화 지원

쿠버네티스(Kubernetes), 싱귤래리티(Singularity), SLURM, TAU 등 시스템 및 워크로드 구축 툴에 대한 새로운 지원


■ 하드웨어 생태계의 확장

HPC 시스템이 지원하는 워크로드에 대한 요구 사항이 점점 까다로워지며 CPU와 가속 카드로 구동되는 이기종 컴퓨팅(heterogenous computing)의 필요성이 중요해졌다. AMD의 파트너사들은 기존의 CPU 전용 컴퓨팅뿐만 아니라 이와 같은 새로운 요구를 충족시키는 플랫폼을 만들고 있다.

기가바이트는 2세대 AMD EPYC 프로세서를 지원하는 4개의 G 시리즈 GPU 서버(G292-Z22, G292-Z42, G482-Z50, G482-Z51)를 발표했다. G482-Z51은 최대 8개의 PCle 4.0 GPU 카드를 지원할 수 있어 다양한 컴퓨팅 워크로드를 위한 훌륭한 “AMD + AMD” 옵션을 고객에게 제공한다.

세계 기록을 경신한 HPE 프로라이언트(ProLiant) DL325 Gen10과 385 Gen10 서버에 최대 64개의 프로세서 코어, 9% 향상된 성능을 지원하는 3200 MT/s 메모리, PCle 4.0을 지원하며 2배 향상된 I/O 대역폭, 전 세대 대비 2.4배 향상된 저장 공간 등을 통해 가상화(virtualization), HPC, 빅데이터 등 핵심 워크로드에서 성능과 효율성이 대폭 개선된 새로운 Gen10 플러스(Plus) 모델이 추가되었다.

최대 8개의 GPU를 지원하는 새로운 펭귄 알투스® (Penguin Altus®) XE4218GT를 통해 펭귄 고객은 2세대 EPYC 및 라데온 인스팅트 MI50의 PCle 4.0 지원을 사용하는 “AMD + AMD” 솔루션을 통해 기계 학습, 빅데이터 분석과 유사한 워크로드를 실행한다.

서버 전문 기업 타이안(Tyan) 또한 HPC에 초점을 맞춘 트랜스포트 HX(Transport HX) 계열의 신제품, 그리고 2세대 AMD EPYC 프로세서를 기반으로 데이터베이스에 초점을 맞춘 트랜스포트 SX(Transport SX) 계열의 제품을 발표했다.

2세대 AMD EPYC 프로세서와 라데온 인스팅트 GPU 가속 카드의 PCle 4.0 지원을 도입하며 AMD는 파트너사들과의 긴밀한 협력을 통해 PCle 4.0 생태계 활성화를 주도해왔다. 2세대 AMD EPYC 프로세서는 PCle 4.0고속 이더넷(ethernet) 및 인피니밴드 인터커넥트(interconnects), NIC 및 스위치, 컴퓨팅 가속 카드(GPU 및 FPGA), 스토리지(NVME SSD) 장치와 같은 PCle 4.0 지원 장치를 지원한다.

2세대 EPYC 프로세서에 PCle 4.0 제품을 제공하는 파트너는 다음과 같다.

200기가바이트 이더넷을 위한 브로드컴 토르 NIC(Broadcom Thor NIC)
최대 400GB/s 속도의 인피니밴드 성능을 제공하는 멜라녹스 커넥트X-6(Mellanox ConnectX-6) NIC
삼성 젠4(Gen4) PM1733 NVME SSD – 삼성 젠3 SSD 대비 2배 향상된 IOPS 제공
자일링스 알비오 U50, U280 FPGA