한국 시간으로 2018년 8월 13일 오후 10시. 최대 32코어 64스레드 구성의 AMD 2세대 라이젠 스레드리퍼 프로세서가 공식 출시되었다.

2017년 라이젠으로 메인스트림 CPU의 코어를 단 번에 두 배로 확장한데 이어, 최근에야 10개에 불과했던 인텔의 하이엔드 데스크탑 CPU보다 여섯 개나 더 코어가 많은 하이엔드 데스크탑 CPU를 내놓은데 이어, 2세대에 들어와서는 스레드리퍼는 하이엔드 데스크탑 CPU의 최대 코어를 단숨에 두 배로 늘리는 기염을 토했다.

인텔도 메인스트림 6코어 CPU를 내놓은데 이어 8코어 CPU 출시를 준비 중이고, 2코어씩 최대 코어를 늘려온 HEDT CPU의 최대 코어를 단숨에 18코어까지 늘린데다, 올해는 28코어의 코어 A 시리즈를 런칭할 예정이다.

아무리 10여년 데스크탑 CPU 확장이 정체되어 있었다고는 하지만, 2세대 스레드리퍼로 정점을 찍은 최근 2년 동안 '빅뱅'으로 불러도 좋을 정도의 갑작스런 코어 확장은 어떻게 바라보아야 할 것인가?

 

높은 처리 성능 요구에 맞춘 2세대 스레드리퍼

잠시 얼마전 게임스컴에서 발표한 튜링 아키텍처에 시선을 맞춰보자.

게이머 입장에서는 아쉽게도 이번 튜링 아키텍처 기반 지포스 RTX 20 시리즈의 레이트레이싱에 대한 이야기가 발표 내용의 대부분을 차지했다. 그에 따라 언급한 내용 중 하나가 바로 영화 최종 렌더링에 쓰이는 CPU보다 30배 빠른 레이트레이싱 성능을 발휘한다는 점이다.

 

범용 프로세서의 한계상 특정 작업의 효율을 높이기 위해 보조 프로세서(코프로세서)가 사용되어 왔고, 최근에는 지포스 RTX 20 시리즈 발표에서 언급된 레이트레이싱, 동영상 캡처 및 변환, 렌더링 가속등에 GPU가 보조 프로세서로 쓰이는 것도 특별한 일은 아니다.

지금은 개인 PC에서 별도의 코프로세서가 사용되는 경우는 볼 수 없지만, 1990년대 후반부터 멀티미디어 지원을 위해 도입된 3D Now나 MMX 같은 SIMD 명령어 지원도 넓은 의미에서 코프로세서의 현대화로 해석할 수 있다.

 

이처럼 코프로세서가 발전하면 CPU는 굳이 발전할 필요가 없지 않을까 생각하기 쉽지만, 코프로세서는 결국 레이트레이싱 가속을 위한 튜링 아키텍처의 RT 코어처럼 특정 작업을 위한 것이고, 이들 코프로세서의 제어와 처리 결과를 반영한 최정 컨텐츠 생산은 여전히 CPU가 담당하게 된다.

이에 따라 사용자는 CPU의 여유 자원을 활용해 추가 작업을 병행하거나 보조 프로세서를 통해 처리된 자료의 가공을 통한 추가적인 부가가치 창출을 노리고, CPU 제조사들은 이러한 요구를 반영해 고클럭/ 다코어 프로세서를 개발해왔다.

그리고 마침내, AMD의 '데스크탑용' 2세대 라이젠 스레드리퍼가 '서버용' 에픽과 같이 최대 32코어까지 확대되기에 이른다.

 

그만큼 높은 수준의 성능을 요구하는 개인 소비자가 확대된 반증으로 볼 수 있다. 이러한 수요가 발생하는 것은 수 십에서 수 백만원에 이르는 비용이 드는 구매 모델 대신, 월 이용료를 지불하는 구독 방식이 도입되면서 필요할 때 쉽게 접할 수 있게된 것과, 시스템 성능과 효율 개선에 따라 인공 지능, 머신 러닝, 자율 주행 자동차, 빅데이터, VR 등 IT의 새로운 영역이 활발하게 연구 개척되고 있는 것을 요인으로 꼽을 수 있다.

 

2세대 라이젠 스레드리퍼의 성능은?

그렇다면 서버급 32코어 CPU인 AMD의 라이젠 스레드리퍼는 어느 정도의 성능을 발휘할까? 서버 CPU 샘플은 확보하지 못한 관계로, 1세대 라이젠 스레드리퍼 1950X 및 2세대 라이젠 7 2700X와 성능을 비교해 보았다.

 

2세대 스레드리퍼 2990WX은  메인스트림 모델인 라이젠 7 2700X와 비교했을 때 렌더링 성능은 약 세 배(어도비 디멘션 CC/ 시네벤치 R15/ 블랜더 2.79) 수준의 성능을, 엔비디아 튜링 발표로 게이머들에게 뜨거운 감자로 떠오른 레이트이싱 성능은 여섯 배(Pov-Ray 3.7)에서 세 배(AIDA64 FP32 Ray-Trace)까지 높은 성능을 발휘하며, 데이터 분석에서도 세 배 이상의 성능을 발휘한다.

 

위 사진은 블렌더의 ClassRoom 렌더링 테스트 상황에서의 시스템 소비 전력을 측정한 것이다. 스레드리퍼 2990WX는 64스레드가 풀로 동작하면서 전체 시스템 소비전력이 350W에 달하며, 8코어인 라이젠 7 2700X 시스템은 200W 수준에 불과하다.

단일 시스템 기준 성능과 소비전력, 가격을 따져보면 스레드리퍼 계열 제품의 메리트가 크게 느껴지지 않을 수 있지만, HEDT 시스템 수준의 성능을 내기 위해 추가로 필요한 메인스트림 시스템 비용과 추가 전력, 배치 공간, 클러스터 구축 및 관리 등의 주변 여건, 즉 전체적인 효율을 감안하면 라이젠 스레드리퍼와 같은 하이엔드 데스크탑은 단순히 보이는 것 이상의 효용성을 제공한다.

 

라이젠 스레드리퍼는 지금까지 하나의 칩에 코어가 집약된 데스크탑용 CPU와 달리, 4개의 코어가 담긴 CCX를 최소 단위로 2개의 CCX가 결합된 모듈을 연결한 MCM(Multi Chip Module) 방식의 제품이다. 따라서 내부 코어간 레이턴시와 특정 모듈에만 활성화된 메모리 컨트롤러 등, 지금까지의 CPU와 다른 구조로 설계되었다. 이에 따라 프로그램이 스레드리퍼의 MCM 구성에 대응하지 못하면 오히려 성능이 낮아지는 경우를 볼 수 있는데, 대표적인 것이 바로 게임이다.

테스트는 지포스 GTX 1080 Ti(게임 레디 398.82 WHQL 드라이버)와 DDR4 2933MHz 32GB(8GB*4, 14-14-14-34) 메모리 구성에서 진행되었고, 스레드리퍼 29990WX의 경우 파 크라이 5에서는 특히 심한 성능 하락이 관측된다.

 

AMD 스레드리퍼, ECC 메모리로 데이터 무결성 강화

AMD 라이젠 스레드리퍼가 2세대로 업그레이드되며 32코어로의 확대가 주목받고 있지만, 사실 AMD 라이젠 스레드리퍼에 주목할 점은 따로 있다. 바로 ECC 메모리 지원.

1세대 라이젠 스레드리퍼 부터 지원해온 ECC(Error Correcting Code) 메모리의 ECC는, 그 이름처럼 데이터 오류를 교정해 무결성을 높여준다. 디지털 데이터에 무슨 오류인가 싶겠지만, 과도한 온도 변화나 전압, 물리적 충격이나 전자기 간섭 등에 의한 데이터 오염이 발생할 수 있다. 사운드 카드의 노이즈도 데이터 오류로 볼 수 있고, 올해 5월, 타이탄 V를 이용한 과학 시뮬레이션에서 결과값에 편차가 발생하는 오류가 이슈화된 것 처럼, 디지털 데이터라고 완전 무결한 것은 아니다.

 

컨텐츠 소비가 주 용도인 메인스트림 사용자라면 이러한 오류가 특별히 문제되는 경우는 극히 드물고, 발생한다 해도 특별히 문제될 경우는 없을 것이다. 그러나 단백질과 효소간 시뮬레이션이나 돈이 오가는 금융 계통, 사람의 생명을 다루는 의료 정보, 인공 지능 및 머신 러닝처럼 상상하기 힘든 대량의 데이터가 활용되는 경우 사소한 오류의 영향으로 전혀 엉뚱한 답을 내놓는다면 작업 속도가 최고로 빠르고 합리적 비용이라도 해당 시스템을 신뢰할 수 없다.

이처럼 사소한 오류도 용납하기 어려운 작업을 위해서는 지금까지 ECC 메모리를 지원하는 고가의 서버용 프로세서를 사용해야 했으나, 라이젠 스레드리퍼는 데스크탑 프로세서임에도 ECC 메모리를 지원, 고가의 서버용 프로세서 구매없이도 데스크탑 수준에서 높은 데이터 무결성을 보장하면서, 데스크탑 CPU 시장에 새로운 전기를 마련했다.

 

2세대 AMD 라이젠 스레드리퍼, PC도 서버급 성능 필요해진 시대의 상징

AMD 2세대 라이젠 스레드리퍼는 서버용 에픽 프로세서와 최대 코어는 동일하지만 데스크탑용 제품인 만큼 코어간 인터커넥트 대역폭(42GB/s -> 25GB/s)과 메모리 채널, PCIe Lane등 일부 스펙이 수정되었다.

다양한 이유가 있겠지만, AMD 2세대 라이젠 스레드리퍼의 32코어 도입은 코드 컴파일링이나 머신 러닝, 에니메이션, 모델링, 4K VR, 자율 주행 등 새로운 영역의 개척과 기존 작업의 고효율 추구 등이 결합되어 PC 수준에서도 서버급 성능의 CPU 필요성이 부각된 때문으로 볼 수 있다.

기존 데스크탑 플랫폼에서 볼 수 없던 ECC 메모리를 통한 데이터 무결성 확보와 최대 2TB에 달하는 메모리 용량 지원 역시 이러한 시대를 반영한 결정으로 볼 수 있고, 때문에 I/O 확장 필요성이 크지 않은 개인이나 중소규모 회사의 서버 혹은 워크스테이션 구성 메리트를 높였다.

 

가격대 성능비를 내세우는 동시에 스레드리퍼 사용자를 향후 자연스럽게 에픽으로의 유도하는 효과도 노린 것으로 해석할 수 있다. 2019년에는 7nm 기반의 Zen2 아키텍처를 앞세워 새로운, 더 많은 코어를 갖춘 에픽 프로세서가 출시된다면 두 제품군의 차이가 다시 명확해 지겠지만, 스레드리퍼 역시 7nm 제품군이 나온다면 그 차이는 또 좁혀질 것이다. 

최종적으로, 2세대 라이젠 스레드피러의 32코어는 서버와 데스크탑간의 자연스런 전환을 노린 전략의 일종으로 볼 수 있다. 아직 효과는 미지수지만, 인텔측에서 AMD가 서버 시장에서 20%의 점유율을 차지하지 못하도록 노력할 것이라는 입장을 밝히며 견제하는 스탠스를 취했다.

이를 감안할 때 AMD 에픽은 전 서버 시장의 99%를 차지하고 있는 것으로 알려졌던 인텔이 의식할 정도의 잠재력을 갖춘 것으로 볼 수 있고, AMD는 에픽을 향한 징검다리로 2세대 스레드리퍼를 준비하며 착실히 미래를 준비 중인 것만은 확실하다.

 

마지막으로, 라이젠 스레드리퍼의 주 용도는 아니지만 '데스크탑' CPU로 구분되는 만큼 게임 성능에 불리한 것은 아쉬운 부분으로 들 수 있다.

단순히 게임 성능이 낮다는 수준이 아니라, 최신 게임 엔진은 게임 내 변경 사항을 바로 플레이하면서 검토할 수 있도록 지원하는데, 스레드리퍼 2990WX의 파 크라이 5 처럼 실제 성능을 반영하기 어렵다면 필요에 따라 별도의 검토용 빌드 구성이 요구될 수 있다.

호환성 모드와 게이밍 모드라는 솔루션을 제공하지만 재부팅이 필요해 작업 연속성 면에서 좋은 평가를 내리기 어렵고, 전체 개발 기간에도 영향을 줄 수 있으므로, AMD는 스레드리퍼의 게임 성능 개선을 위해 게임 엔진이나 개발사들과 보다 적극적으로 협력해야 할 것이다.



Copyrightⓒ 넥스젠리서치(주) 보드나라 미디어국. www.bodnara.co.kr