기사 원문 - https://www.hardwaretimes.com/nvidia-rtx-4090-final-specifications-leak-out-16128-cores-24gb-gddr6x-450w-2x-faster-than-the-rtx-3090-report/
 
NVIDIA의 Lovelace 플래그십 사양이 확정된 것으로 보입니다. AD102 다이를 활용하는 GeForce RTX 4090은 126개의 SM, 63개의 TPC 및 11개의 GPC에 걸쳐 총 16,128개의 FP32 코어를 특징으로 합니다. 이 거대한 다이는 RTX 3090 Ti와 동일한 384비트 버스에서 24GB의 21Gbps GDDR6X 메모리와 쌍을 이룹니다. Lovelace는 Hopper의 일부 기능, 특히 96MB의 L2 캐시와 함께 SM 활용도와 대역폭을 크게 높이는 스레드 블록 메모리 공유를 차용할 가능성이 높습니다.

호퍼 백서를 놓친 경우를 대비하여 스레드 블록 클러스터 및 분산 공유 메모리(DSM)에 대한 간단한 입문서가 있습니다. 100개 이상의 SM이 있는 GPU에서 보다 효율적으로 스케줄링하기 위해 Hopper와 Lovelace는 GPC의 모든 2개의 스레드 블록을 클러스터로 그룹화합니다. 스레드 블록 클러스터의 주요 목표는 멀티스레딩 및 SM 활용을 개선하는 것입니다. 이러한 클러스터는 GPC의 SM에서 동시에 실행됩니다.

클러스터의 두 스레드 블록 간의 SM-to-SM 네트워크 덕분에 데이터를 효율적으로 공유할 수 있습니다. 이것은 코어/ALU 수를 50% 이상 늘릴 때 핵심 요구 사항인 Hopper 및 Lovelace에서 확장성을 촉진하는 주요 기능 중 하나가 될 것입니다.

마지막으로, RTX 4090은 전체 지방 AD102 다이를 특징으로 하지 않지만 이전 제품보다 두 배의 성능을 제공한다는 점을 잊지 마십시오. TGP는 결국 "그냥" 450W가 될 것이며, 이전에 소문이 난 600-900W와는 거리가 멀습니다. 완전히 활성화된 AD102 다이로 주기의 후반에 출시될 수 있는 RTX 4090 Ti는 600W TGP와 함께 제공될 가능성이 더 큽니다.