기사 원문 - https://nvidianews.nvidia.com/news/nvidia-vera-rubin-platform
 

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 아시아 최대 ICT 전시회 컴퓨텍스(COMPUTEX) 2026을 맞이해 개최한 엔비디아 GTC 타이베이(NVIDIA GTC Taipei)에서 전 세계 에이전틱 AI 팩토리를 구동하기 위한 엔비디아 베라 루빈(Vera Rubin) 플랫폼의 양산을 시작했다고 발표했다.

 

대만의 주요 서버 제조사와 글로벌 공급망 선도 기업들은 베라 루빈 기반 시스템을 대규모로 제조하고 있다이를 통해 AI 연구소클라우드 제공업체하이퍼스케일러가 차세대 인텔리전스를 구축할 수 있도록 지원하고 있다.

 

베라 루빈은 엔비디아의 가장 광범위한 POD 규모 플랫폼으로, 5개의 전용 랙이 하나의 대규모 AI 슈퍼컴퓨터처럼 작동해 에이전틱 워크로드를 처리한다이 플랫폼은 엔비디아 베라 루빈 NVL72 시스템엔비디아 베라 CPU, 엔비디아 그록 3(Groq 3 LPX), 엔비디아 베라 블루필드-4 STX(BlueField-4 STX) 스토리지엔비디아 스펙트럼™-6 SPX 이더넷(Spectrum-6 SPX Ethernet) 랙을 완전 통합 시스템으로 결합한다베라 루빈은 대규모 환경에서 이전 세대 엔비디아 그레이스 블랙웰(Grace Blackwell) 플랫폼 대비 10배 높은 에이전트 처리량을 제공한다.

 

엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “에이전틱 AI는 새로운 유형의 워크로드다단 하나의 프롬프트만으로도 추론검색도구 활용응답 생성에 이르는 수천 단계의 여정이 시작될 수 있다베라 루빈은 바로 이 순간을 위해 설계됐다차세대 산업 혁명을 구동하는 데 필요한 성능효율보안을 바탕으로 대규모 인텔리전스를 제공하는 AI 팩토리 엔진이다”라고 말했다.

 

베라 루빈 생산 확대

베라 루빈은 3세대 엔비디아 MGX™ 랙스케일 시스템이다검증된 오픈소스 MGX 설계를 기반으로수백 개의 엔비디아 공급망 생태계 파트너가 30개국 350개 이상의 공장에서 베라 루빈 생산을 확대하고 있다특히 대만에만 150개 파트너가 참여하고 있다.

 

주요 시스템 구축업체인프라 소프트웨어스토리지 파트너들은 베라 루빈 양산에 돌입했다여기에는 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro)를 비롯해 AIC, 에이브레스(Aivres), 애즈락 랙(ASRock Rack), 에이수스(ASUS)클라우디안(Cloudian), 컴팔(Compal), DDN, 에버퓨어(Everpure), 폭스콘(Foxconn), 기가바이트(GIGABYTE), 히타치 밴타라(Hitachi Vantara), 하이브 솔루션스(Hyve Solutions), IBM, 인벤텍(Inventec), 민아이오(MinIO), 미텍 컴퓨팅(MiTAC Computing), MSI넷앱(NetApp), 뉴타닉스(Nutanix), 페가트론(Pegatron), 콴타 클라우드 테크놀로지(Quanta Cloud Technology, QCT), 바스트 데이터(VAST Data), 웨카(WEKA), 위스트론(Wistron), 위윈(Wiwynn)이 포함된다.

 

100 GPU AI 팩토리를 위한 패브릭 구축

스케일아웃(scale-out)과 스케일어크로스(scale-across) 기반의 AI 팩토리 배포를 지원하기 위해 베라 루빈 플랫폼은 현재 생산 중인 엔비디아 스펙트럼-X™ 이더넷 포토닉스(Photonics)를 도입한다이는 200Gb/s 서데스(SerDes)를 탑재한 세계 최초의 공동 패키징 광학(CPO) 기반 스위치다.

 

스펙트럼-X 이더넷 포토닉스는 CPO 기반의 차세대 스위칭 기술로기존 트랜시버를 사용하는 네트워크 대비 전력 효율을 5배 높이고, AI 가동 시간을 5배 늘리며배포 시간을 1.3배 단축한다.

 

엔비디아 CPO 네트워킹은 설계를 단순화하고 컴퓨팅 연산에 더 많은 전력을 할당할 수 있도록 돕는다이를 통해 100만 개 규모 GPU 가동 AI 팩토리를 위한 핵심 패브릭을 제공한다코어위브(CoreWeave), 람다(Lambda)오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)가 초기 생태계 파트너와 도입 기업으로 참여한다.

 

또한 엔비디아 베라 루빈 플랫폼은 엔비디아 블루필드®-4 DPU도 통합한다블루필드-4 DPU는 최대 800Gb/s 속도의 소프트웨어 정의 네트워킹과 내장형 멀티테넌트 격리 기능을 제공한다고객은 엔비디아 블루필드-4 고급 보안 신뢰 아키텍처(Advanced Secure Trusted Resource Architecture)를 통해 네트워크 운영을 간소화하고테넌트 격리 성능을 높이며, 100 GPU AI 클러스터 전반에 걸쳐 더 높은 수준의 제어력을 확보할 수 있다.

 

AI 팩토리를 위한 안전한 AI

AI 팩토리는 에이전틱 워크플로우에서 기업 고유 데이터규제 대상 콘텐츠미션 크리티컬 모델을 점점 더 많이 처리하고 있다이에 따라 인프라를 암묵적으로 신뢰할 수 없는 공유 또는 클라우드 환경에서 자율 에이전트에 맞춰 설계된 첨단 인프라 보안이 필요하다.

 

베라 루빈 플랫폼은 랙스케일의 신뢰 실행 환경(TEE)을 위해 풀스택 엔비디아 컨피덴셜 컴퓨팅(Confidential Computing)을 기반으로 설계됐다베라 루빈 NVL72는 베라 CPU, 루빈 GPU, 엔비디아 NV링크™(NVLink네트워킹보안 기능을 통합 플랫폼으로 결합하며고속 인터커넥트 전반에서 데이터를 암호화한다이를 통해 시스템이 변조되지 않았음을 보장하는 하드웨어 수준의 증명을 제공한다.   

 

클라우드 제공업체인 코어위브퍼머스(Firmus), GMI 클라우드(GMI Cloud), IBM 클라우드(IBM Cloud), 아이렌(IREN), 람다마이크로소프트 애저(Microsoft Azure), 네비우스(Nebius), 엔스케일(Nscale), 스페이스XAI(SpaceXAI), 벌처(Vultr)가 엔비디아 컨피덴셜 컴퓨팅을 도입하고 있다.

 

POD 규모에서 이러한 수준의 보호를 제공하려면 전체 시스템에 걸쳐 보안 정책을 적용오케스트레이션조정할 수 있는 프로그래머블 소프트웨어 계층도 필요하다엔비디아 도카™(DOCA소프트웨어 플랫폼은 모든 베라 루빈 플랫폼 랙과 AI 팩토리의 각 계층 전반에 첨단 보안을 제공한다블루필드-4 실리콘 하드웨어에서 직접 적용되는 기능을 통해 데이터에이전트컨텍스트 메모리, AI 추론을 보호한다.

 

도카는 호스트 CPU 리소스에 부담을 주지 않으면서 최대 800Gb/s 속도로 멀티테넌트 네트워크 격리제로 트러스트 정책 적용런타임 위협 탐지엔드--엔드 암호화를 지원한다이를 통해 기업은 AI 팩토리를 안정적으로 확장할 수 있다.

 

AI 팩토리 구축 가속화

엔비디아 DSX™ 플랫폼은 베라 루빈 AI 팩토리를 위한 완전한 설계와 운영 기반을 제공한다레퍼런스 설계시뮬레이션인프라 소프트웨어설비생태계 기술을 통합해 토큰 비용을 최소화하도록 최적화된 에너지 효율적인 AI 팩토리의 구축과 운영을 지원한다.

 

베라 루빈 POD 아키텍처에 맞춰 설계된 DSX는 실리콘과 시스템부터 수명주기 관리멀티테넌트 운영에 이르기까지 스택의 모든 계층을 일관되게 조율한다이를 통해 배포를 크게 가속화하고대규모 환경에서 운영 신뢰성과 복원력에 대한 새로운 기준을 제시한다.

 

델 테크놀로지스, HPE, 레노버슈퍼마이크로는 에이수스폭스콘기가바이트페가트론, QCT, 위스트론위윈과 함께 엔비디아 DSX를 도입해 베라 루빈 기반 AI 팩토리 구축 속도를 가속화하고 있다.

 

이용 정보

베라 루빈의 양산 제품 출하는 올해 가을부터 시작될 예정이다.