많은 게이머들이 기다려온 엔비디아의 GeForce RTX 40 시리즈에 대한 공식 정보가 22년 9월 21일 0시, 엔비디아 GTC '지포스 비욘드: GTC 스페셜 방송'을 통해 공개됐다. 방송은 엔비디아의 창업자 겸 CEO인 젠슨 황이 맡았다.

새로운 Ada Lovelace 아키텍처를 채택한 이번 RTX 40 시리즈 중 RTX 4090과 RTX 4080이 우선 공개되었다. RTX 4090은 RTX 3090Ti 대비 2배의 퍼포먼스를 자랑할 예정이며 10월 12일에 판매될 계획이다. VRAM 16GB와 12GB로 나뉘어 출시될 RTX 4080은 RTX 3080Ti 대비 2배의 빠른 속도를 제공할 예정이며 11월부터 만나볼 수 있게 된다. 엔비디아 공식 가격은 각각 1599달러, 1199달러, 899달러로 책정되었다. (223만 원, 167만 원, 120만 원, 22.09.21 환율 기준)

RTX 4090은 24GB의 G6X VRAM을 지원하며 16,384개의 쿠다 코어(CUDA Core), 1,321개의 Tensor-TFLOP, 191개의 RT-TFLOP 및 83개의 Shader-TFLOP를 탑재했다. 새로운 Ada 아키텍처의 신기술인 DLSS 3, SER 등을 활용할 경우, 최적화된 사이버펑크 2077, 포탈 with RTX 등의 친화적인 타이틀에서 최대 4배 이상 향상된 성능을 체험할 수 있다.

RTX 4080(16GB)은 9.728개의 쿠다 코어, 780개의 Tensor-TFLOP, 113개의 RT-TFLOP, 49개의 Shader-TFLOP 및 GDDR6X 메모리를 지원한다. RTX 4080(12GB)는 7,680개의 쿠다 코어, 639개의 Tensor-TFLOP, 92개의 RT-TFLOP, 40개의 Shader-TFLOP 및 GDDR6X 메모리를 통해 현재 최고의 성능을 자랑하는 RTX 3090Ti를 뛰어넘는 성능을 자랑한다.

▲ 최고 수준의 성능은 어느 정도일까? RTX 4090!

▲ 16GB와 12GB로 나누어 출시되는 RTX 4080

▲ RTX 40 시리즈의 출시와 함께 RTX 30 시리즈의 공식 가격 인하도 공개했다

▲ RTX 4090 FE 제품도 공개했다

▲ 외관상 굉장히 튼튼해 보이는 RTX 40 시리즈 비 레퍼런스 제품들

엔비디아는 RTX 40 시리즈의 파운더스 에디션 그래픽카드(Founders Edition, FE)를 공개했으며, 비 레퍼런스 그래픽카드 제조사인 ASUS, Colorful, Gainward, Galaxy, GIGABYTE, INNO3D, MSI, Palit, PNY 및 ZOTAC와의 협업을 알렸다. 또한 Acer, Alienware, ASUS, Dell, HP, Lenovo 및 MSI와의 선도적인 시스템을 위한 완제품 PC 파트너와의 협업도 밝혔다.

사용자는 새로운 엔비디아 Ada Lovelace 아키텍처를 통해 성능, 효율성 및 기능 면에서 높은 성능 향상을 기대할 수 있다. 최대 760억 개의 트랜지스터(지난 세대에서 280억 개)가 있는 맞춤형 TSMC 4N 프로세스를 기반으로 한다.

Ada는 RTX 30시리즈에서 채택한 Ampere 아키텍처 대비 동일한 전력에서 2배 이상의 성능을 제공하며, 전력이 증가함에 따라 높은 확장성과 오버클럭 가능성을 제공한다. GPU 아키텍처는 고도로 병렬화되어 유사한 워크로드를 동시에 실행할 때 가장 효율적이다. 그러나 고급 레이 트레이싱은 장면 전체에 걸쳐 수많은 다양한 재질, 모양 등 유형에 충돌하는 수백만 개의 광선을 계산하여 셰이더에 대해 발산되고 비효율적인 일련의 작업 부하를 감당하게 된다.

엔비디아의 새로운 SER(Shader Execution Reordering) 기술은 비효율적인 워크로드를 동적으로 재구성하여 셰이더 성능을 최대 2배, 게임 내 프레임 속도를 최대 25%까지 향상시킬 수 있게 되었다고 밝혔다. 엔비디아는 실시간 비디오 게임의 레이 트레이싱을 현실로 만들었다. Ada의 3세대 레이 트레이싱 코어는 2배의 광선-삼각형 교차 처리량을 제공하여 RT-TFLOP 성능을 최대 2.8배까지 증가시킨다.

엔비디아 텐서 코어(NVIDIA Tensor Core)는 216개의 출시 게임 및 앱에서 사용할 수 있는 엔비디아 DLSS를 가속화한다. Ada의 새로운 4세대 텐서 코어는 새로운 8비트 부동 소수점(FP8) 텐서 엔진을 사용하며 이는 RTX 4090에서의 처리량을 최대 5배, 1.32 Tensorpeta FLOPS로 높인다. 게이머는 이를 통해 엔비디아의 새로운 DLSS 3을 경험할 수 있으며 쾌적한 프레임 속도를 맛볼 수 있다.

▲ RTX 4090 게임 성능 그래프

▲ RTX 4080 게임 성능 그래프

▲ 이제 QHD 환경에서 저사양 게임을 평균 360FPS로 즐길 수 있다! 이는 프로게이머를 타깃 했다고 한다

▲ DLSS 3 지원 고사양 게임들