[자료제공: AMD]


AMD(NASDAQ: AMD)는 미국 샌프란시스코에서 진행된 넥스트 호라이즌(Next Horizon) 행사에서 오늘날 데이터센터의 성능 확대를 위한 7nm 공정 기반 제품 포트폴리오를 공개했다.

AMD는 행사를 통해 자사의 혁신적인 칩렛 기반 x86 CPU 디자인 '젠2(Zen 2)' 프로세서 코어 아키텍처를 공개하고, 7nm 공정 기반의 AMD 라데온 인스팅트™(Radeon Instinct™) MI60 그래픽 가속기 및 차세대 에픽™(EPYC™) 서버 프로세서((코드명: 로마(Rome))를 최초로 선보였다.

또한, AMD는 클라우드 플랫폼 리딩 업체 아마존웹서비스(Amazon Web Services, 이하 AWS)의 아마존 엘라스틱 컴퓨트 클라우드(Amazon Elastic Compute Cloud, 이하 EC2) 서비스 내 인스턴스 제품군 3종에 AMD 에픽 프로세서를 지원하게 됐다고 발표했다.

AMD 회장 겸 CEO 리사 수(Lisa Su) 박사는 “AMD가 수년간 투자해 온 자사의 데이터센터 하드웨어 및 소프트웨어 로드맵은 클라우드, 엔터프라이즈 및HPC 고객으로부터 지속적으로 선택받고 있다”며, “AMD는 앞으로 업계를 선두하는 7nm 공정 기술 기반의 업계 내 가장 광범위하고 강력한 데이터센터 CPU 및 GPU 포트폴리오를 공개할 예정으로, 현재의 모멘텀에 박차를 가할 준비가 완료됐다”고 강조했다.


■ AMD 컴퓨트 아키텍처 업데이트

AMD는 자사의 혁신적인 모듈형 디자인 설계의 결실인 '젠2' 아키텍처 기반 고성능 x86 CPU 코어 프로세서에 대해 최초로 발표했다. AMD 모듈형 시스템 디자인은 AMD 인피니티 패브릭(AMD Infinity Fabric) 상호 기술의 향상된 버전을 활용해, 하나의 프로세서 패키지 내 분리된 실리콘 조각인 칩렛(chiplet)을 서로 연결한다.

칩 내 I/O(입출력)에는 보다 완성도 높은 14nm 공정 기술을 사용하고, 젠2 CPU 코어를 위한 고급 7nm 공정 기술을 활용하는 멀티 칩 프로세서로, 향상된 프로세서 기술을 십분 활용할 수 있다. 따라서, 해당 프로세서는 동일한 전력으로 더 많은 CPU 코어를 지원하고, 기존의 단일 칩 디자인 대비 보다 높은 비용 효율성의 기술을 제공하는 등 궁극적으로 훨씬 높은 성능을 제공할 예정이다.

AMD의 젠 2 아키텍처는 자사의 혁신적인 설계 디자인을 TSMC의 최첨단 7nm 공정 기술과 결합해 탁월한 성능 및 소비 전력을 제공하며, 전세대의 집적도를 개선해 데이터센터 관리 비용, 탄소 발자국(carbon footprint) 및 냉각 요건을 절약한다. 젠 코어의 주요 향상점은 다음과 같다.

  • 보다 효율적인 컴퓨트 엔진 활용을 위한 실행 구조 향상
  • 프론트 엔드(front-end) 기능 향상: 분기 예측(branch predictor) 및 명령 프리페칭(pre-fetching) 성능 향상, 명령 캐시(instruction cache) 최적화 및 보다 높은 OP 캐시 제공
  • 연산 속도(floating point, FLOPS) 향상: 256비트(bit)까지 두 배 가량 향상된 연산 속도와 로딩 및 저장을 위한 대역폭, 더 높아진 디스패치 및 리타이어(retire) 대역폭 향상 및 전체 모드에서 높은 스루풋 지속
  • 보안 기능 향상: 소프트웨어를 디자인에 포함시켜 하드웨어 부분에서 향상된 스펙터(Spectre) 보완 및 메모리 암호화

  • AMD가 이번 행사에서 공개한 AMD 에픽 CPU 및 라데온 인스팅트 GPU 포함 7nm 공정 기반의 제품군은 현재 개발 중이다. 또한, AMD는 7nm+ 공정 기반의 '젠3(Zen 3)' 및 '젠 4(Zen 4)' x86 코어 아키텍처도 AMD 로드맵에 발맞춰 순조롭게 개발 중이라고 발표했다.


    ■ 세계 최초 7nm 공정 기반 데이터센터용 GPU 공개

    AMD(NASDAQ: AMD)는 세계 최초의 7nm 공정 기반 데이터센터용 GPU인 라데온 인스팅트™(Radeon Instinct™) MI60 및 MI50 가속 카드를 공개했다.

    새로운 제품들은 모두 차세대 딥러닝, 고성능 컴퓨팅(HPC), 클라우드 컴퓨팅, 렌더링 응용 프로그램 구동을 위한 탁월한 컴퓨트 성능을 제공한다. 궁극적으로 연구자, 과학자, 개발자들이 대규모 시뮬레이션, 기상 예측, 컴퓨터 생명 공학, 질병 예방 등의 난제 해결에 도움을 줄 것이다.

    AMD 라데온 테크놀로지 그룹 엔지니어링 부문 수석 부사장인 데이비드 왕(David Wang)은 “오늘날의 클라우드 데이터센터에서 발생하는 엄청난 양의 데이터를 분석하고 처리함에 있어, 기존 GPU 아키텍처는 한계가 있다”며, “AMD가 새롭게 선보인 라데온 인스팅트 가속 카드는 세계 최고 수준의 성능과 유연한 아키텍처를 기반으로 견고한 ROCm 소프트웨어 플랫폼을 지원한다. 업계를 선도하는 ROCm 오픈 소프트웨어 생태계에서 클라우드 컴퓨팅 분야 내 가장 복합적인 작업을 수행하는 데 중요한 역할을 하게 될 것”이라고 덧붙였다.

    AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 고성능 컴퓨트 유닛이 내장되어 유연한 혼합 정밀도(mix
    ed-precision)를 제공한다. 이를 바탕으로 고성능 컴퓨팅, 딥러닝 응용 프로그램 등 신형 가속 카드가 지원하는 작업의 유형을 확장할 수 있다. 이와 더불어 빠른 속도의 복합 신경망 훈련, 높은 수준의 부동소수점(floating-point) 성능, 향상된 효율성, 데이터센터 전체 혹은 부분 적용을 위한 새로운 기능을 지원하는 등 다양한 작업을 효율적으로 처리하도록 고안됐다.

    AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 초고속 부동수소점 성능과 최대 1TB/s의 처리 속도를 제공하는 초고속 HBM2 메모리(2세대 고대역폭 메모리)를 제공한다. 차세대 PCle® 4.0을 지원하는 최초의 GPU로, x86 기반에서 CPU와 GPU를 연결하는 데 기존 기술보다 최대 2배 빠른 속도를 제공한다. AMD 인피니트 패브릭™(AMD Infinite Fabric™) 기술이 GPU 간 연결을 지원하며, 3세대 PCle® 대비 최대 6배 향상된 속도를 제공한다.

    또한, AMD는 신형 가속 카드의 기능과 호환되는 새로운 버전의 ROCm 오픈 소스트웨어 플랫폼도 함께 발표했다. 새로운 ROCm 플랫폼은 고객이 고성능의 에너지 효율성이 높은 이종 컴퓨팅 플랫폼을 개방형 생태계에 적용할 수 있도록 돕는다.

    구글 텐서플로우(TensorFlow)의 라잣 몬가(Rajat Monga) 엔지니어링 담당 디렉터는 “구글은 오픈 소스가 모든 이에게 유용할 것으로 판단한다”며, “오픈 소스 기반 머신 러닝 기술의 유용성은 충분히 입증되었으며, AMD는 이를 입증해 나가고 있다. ROCm 개방형 소프트웨어 플랫폼 기반에서 텐서플로우를 사용하는 고객들이 GPU 가속 카드와 오픈 소스 머신러닝 생태계에서 보다 많은 혜택을 누릴 수 있을 것으로 기대한다”고 밝혔다.