자료제공- 엔비디아


AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 엣지(edge)에서 낮은 지연시간으로 실시간 인공지능(AI) 수행이 가능한 가속 컴퓨팅 플랫폼 ‘엔비디아 EGX(NVIDIA EGX)’를 발표했다. 이 플랫폼은 기업들이 5G 기지국, 웨어하우스, 리테일, 공장 등에서 발생하는 연속 스트리밍 데이터를 실시간으로 감지, 이해 및 대응할 수 있도록 돕는다.


<가속 컴퓨팅 플랫폼 엔비디아 EGX>

엔비디아 EGX는 클라우드로 전송돼야 하는 데이터 양을 줄이는 동시에, 데이터가 생성되는 엣지에서 즉각적이며 높은 스루풋(throughput)의 AI를 수행하려는 수요를 충족시키기 위해 개발됐다.

시장조사기관 IDC에 따르면, 2025년에는 1,500억여 머신 센서와 사물인터넷(IoT) 디바이스가 처리돼야 할 연속 데이터를 스트리밍할 것으로 예상된다. 이는 스마트폰을 사용하는 개인으로부터 발생하는 데이터보다 많은 양이다. 엔비디아 EGX 플랫폼과 같은 엣지 서버는 전세계에 걸쳐 이러한 센서로부터 데이터를 실시간으로 처리하는데 사용될 것이다.

밥 피트(Bob Pette) 엔비디아 엔터프라이즈 및 엣지 컴퓨팅 부문 부사장 겸 총괄은 “기업들은 고객과 디바이스 간의 무수한 상호작용으로부터 스트리밍 되는 방대한 양의 로우 데이터(raw data)를 처리하기 위해 엣지에서 보다 강력한 컴퓨팅을 필요로 하고 있다. 즉, AI 성능이 향상된 신속한 의사결정을 통해 비즈니스를 추진하고자 한다. 엔비디아 EGX와 같은 확장 가능한 플랫폼은 온프레미스 및 클라우드 환경 모두에서 시스템을 쉽게 구축함으로써 기업의 요구사항을 충족시킬 수 있다“고 말했다.

엔비디아 EGX는 소형 AI 컴퓨터 엔비디아 젯슨 나노(NVIDIA Jetson Nano)로 시작 가능하며, 이미지 인식과 같은 작업을 처리하기 위해 불과 몇 와트에 불과한 저전력으로 1초당 5천억 회의 연산이 가능하다. 또한, 이 제품은 실시간 음성 인식 및 기타 실시간 AI 작업을 위해 최대 1만 초당테라연산(TOPS)의 성능을 제공하는 엔비디아 T4 서버의 전체 랙으로 연결된다.

엔비디아는 레드햇(Red Hat)과 협력해 엔터프라이즈급 쿠버네티스(Kubernetes) 컨테이너 오케스트레이션(orchestration) 플랫폼인 오픈시프트(Openshift)와 엔비디아 엣지 스택(NVIDIA Edge Stack)을 통합 및 최적화했다.

엔비디아 엣지 스택은 엔비디아 드라이버, 쿠다 쿠버네티스 플러그인(CUDA® Kubernetes plugin), 쿠다 컨테이너 런타임(CUDA container runtime), 쿠다-X 라이브러리(CUDA-X™ libraries), 텐서RT(TensorRT™), 텐서RT 인퍼런스 서버(TensorRT Inference Server)와 딥스트림(DeepStream)을 포함한 컨테이너형 AI 프레임워크 및 애플리케이션을 포함한 소프트웨어에 최적화돼 있다. 엔비디아 엣지 스택은 엔비디아 NGC 레지스트리(NVIDIA NGC™ registry)에서 다운받을 수 있다.

레드햇 최고 기술 책임자인 크리스 라잇(Chris Wright)은 “레드햇은 하이브리드 클라우드에서부터 엣지에 이르는 모든 워크로드, 풋프린트(footprint), 로케이션(location)에서 일관된 경험을 제공하기 위해 노력하고 있다. 레드햇 오픈시프트와 엔비디아 EGX 지원 플랫폼을 결합함으로써 고객은 고성능의 컨테이너 중심 환경에서 분산 운영 더욱 최적화할 수 있게 됐다”고 말했다.

엔비디아 EGX는 엔비디아의 모든 AI 컴퓨팅 기술, 그리고 레드햇 오픈시프트 및 엔비디아 엣지 스택을 멜라녹스(Mellanox) 및 시스코(Cisco)의 보안, 네트워킹 및 스토리지 기술과 결합한다. 이를 통해 통신, 제조, 소매, 헬스케어, 운송 등을 포함한 주요 산업분야 기업들은 최첨단의 엔터프라이즈급 AI 인프라를 신속하고 안전하게 구축할 수 있다.

멜라녹스의 최고 기술 책임자인 마이클 케이건(Michael Kagan)은 “멜라녹스 스마트 NIC와 스위치는 엣지에서 하이퍼스케일 데이터 센터까지 확장되는 데이터 액세스를 위한 이상적인 I/O 연결을 제공한다. 고성능, 낮은 레이턴시 및 가속화된 네트워킹의 조합은 엔비디아 EGS와 같은 엣지 플랫폼상에서 차세대 AI 솔루션을 구현하는데 필요한 데이터에 효과적으로 액세스하고 이를 공급하는데 필수적인 새로운 인프라 티어를 제공한다”고 설명했다.

시스코 컴퓨팅 시스템 부사장 카우스투브 다스(Kaustubh Das)는 “시스코 컴퓨트, 패브릭, 스토리지, 관리 소프트웨어는 물론 우리의 업계 선도적인 이더넷 및 IP 기반 네트워킹 기술과 EGX 지원 플랫폼을 활용해 고객을 위한 엣지 투 코어(edge-to-core) 풀 스택 솔루션을 제공할 수 있게 되어 기쁘다”고 말했다.