|
2026-01-10 02:18
조회: 3,731
추천: 0
DLSS 4.5, 구형 그래픽카드에서 성능저하 뚜렷
독일 매체 컴퓨터베이스와 유튜브 채널 하드웨어 언박스드가 독립적으로 실시한 테스트에 따르면, RTX 20 시리즈와 RTX 30 시리즈에서 평균 12%의 성능 손실이 발생했다. DLSS 4.5는 2세대 트랜스포머 모델을 기반으로 한다. 엔비디아는 새로운 모델이 조명 정확도를 개선하고 고스팅을 줄이며 시간적 안정성을 향상시킨다고 밝혔다. 이러한 개선은 확장된 학습, 알고리즘 개선, 그리고 5배 증가한 연산량을 통해 달성되었다. 엔비디아의 제이콥 프리먼은 소셜 미디어를 통해 "DLSS 4.5는 5배 더 많은 연산을 사용한다"며 "RTX 50 시리즈에서는 약 2-3%의 성능 저하만 발생하지만, 이미지 품질 향상 효과는 매우 크다"고 설명했다. 컴퓨터베이스의 테스트 결과, DLSS 4.5의 새로운 "모델 M(Model M)" 프리셋은 노이즈가 많은 그림자, 물 렌더링, 깜빡이는 식물 등 DLSS 4의 여러 아티팩트를 개선했다. 그 결과 더 깨끗한 비주얼과 향상된 시간적 안정성을 제공한다. 그러나 RTX 5070 Ti와 RTX 4080 슈퍼에서는 약 4~5%의 성능 저하가 발생했으며, RTX 3090 Ti와 RTX 2080 Ti에서는 평균 약 12%의 성능 손실이 나타났다. 하드웨어 언박스드의 테스트에서는 더 큰 성능 차이가 확인되었다. RTX 5070과 같은 중급 블랙웰(Blackwell) GPU에서는 DLSS 4.5가 DLSS 4보다 약 9% 느렸으며, 앰페어(Ampere)와 튜링(Turing) 아키텍처 기반 모델에서는 20~30%까지 느려졌다. RTX 40과 RTX 50 시리즈 카드는 네이티브 렌더링 대비 허용 가능한 프레임 레이트 향상을 유지했지만, 구형 시리즈에서는 스케일링이 감소하거나 심지어 부정적인 결과를 보였다. 이러한 성능 차이는 하드웨어 아키텍처의 차이에서 기인한다. DLSS 4.5는 FP8(8비트 부동소수점) 가속을 광범위하게 활용하는데, RTX 40과 RTX 50 시리즈는 텐서 코어(Tensor Core)에서 FP8을 지원하지만 RTX 20과 RTX 30 시리즈는 이를 지원하지 않는다. RTX 20과 RTX 30 시리즈의 텐서 코어는 FP16만 네이티브로 지원하기 때문에, 동일한 작업을 수행하는 데 최소 두 배의 사이클이 필요하다. 데이터를 먼저 FP16으로 "역양자화(dequantize)"해야 하기 때문이다. 커뮤니티 사용자들의 실제 테스트 결과도 이를 뒷받침한다. 엑스(X, 구 트위터) 사용자 모스틀리 포지티브 리뷰스는 RTX 3080 Ti를 사용해 사이버펑크 2077을 테스트한 결과, 4K 레이트레이싱 울트라 프리셋에서 DLSS 퀄리티 모드를 사용했을 때 DLSS 4.5가 DLSS 4 대비 24%의 성능 저하를 보였다고 보고했다. 프레임 레이트는 42fps에서 32fps로 떨어졌다. 1440p 해상도에서는 14%의 성능 저하가 발생해 72fps에서 61fps로 하락했으며, 레이트레이싱을 비활성화한 1440p에서는 20% 감소하여 108fps에서 86fps로 떨어졌다. 엔비디아는 사용자들이 자신의 GPU 세대에 맞는 적절한 DLSS 프리셋을 선택할 것을 권장하고 있다. DLSS 4.5는 세 가지 새로운 프리셋을 제공한다. 프리셋 K는 DLAA, 퀄리티, 밸런스드 모드의 기본값으로 구형 프리셋보다 오버헤드가 적다. 프리셋 M은 퍼포먼스 모드에 최적화되어 있으며 프리셋 L과 유사한 아티팩트 개선 효과를 제공하면서도 비용이 적게 든다. 프리셋 L은 울트라 퍼포먼스 모드의 기본값으로, 4K 울트라 퍼포먼스와 같은 고강도 업스케일링 시나리오에 맞춰 조정되었다. 엔비디아는 RTX 20과 RTX 30 시리즈 사용자들에게 더 높은 프레임 레이트를 원한다면 기존 모델 K 프리셋을 유지할 것을 권장한다. 사용자들은 엔비디아 앱(NVIDIA App)의 "DLSS 오버라이드 - 모델 프리셋"에서 "커스텀"을 선택한 후 "슈퍼 레졸루션" 프리셋을 "프리셋 K"로 변경하여 이전 DLSS 4 슈퍼 레졸루션 모델로 되돌릴 수 있다. VRAM(비디오 메모리) 사용량도 크게 증가했다. 보고서에 따르면 최신 DLSS 4.5는 RTX 40/50 시리즈 GPU에서 40~53% 더 많은 VRAM을 필요로 하며, RTX 20과 30 시리즈에서는 무려 87~103% 더 많은 VRAM이 필요하다. 이미 8GB GPU를 사용하는 사용자들은 특히 FP8 정밀도 부족의 영향을 받고 있는 상황에서 실질적인 성능 병목 현상을 겪을 수 있다. 양쪽 리뷰 모두 DLSS 4.5의 높은 연산 부하가 명확한 시각적 개선을 가져온다는 점에 주목했다. 특히 물, 그림자, 움직임 안정성 부분에서 개선이 두드러진다. 그러나 업데이트의 혜택은 주로 최신 GPU에 국한된다는 것이 중론이다. 엔비디아 자체도 새로운 모델 프리셋에는 RTX 40 이상의 카드를 권장하고 있다. 컴퓨터베이스는 전체 4K 이미지 비교 갤러리를 공개했으며, 하드웨어 언박스드는 CES 보도 이후 전용 이미지 품질 분석을 계획하고 있다. DLSS 4.5는 현재 최신 지포스 드라이버를 통해 모든 RTX GPU에서 사용할 수 있다. 소스: https://videocardz.com/newz/nvidia-dlss-4-5-test-on-rtx-50-40-30-and-20-series-shows-12-performance-loss-on-ampere-turing-series https://www.computerbase.de/artikel/grafikkarten/nvidia-dlss-4-5-super-resolution-test.95687/seite-3 https://www.youtube.com/watch?v=36zbGPECzDI
|

