소식

NVIDIA의 "AI Box"는 소프트웨어와 서비스를 업그레이드 및 출시하고 Jen-Hsun Huang은 실제 세계의 디지털 복사본을 만듭니다.

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Text/Tencent Technology Li Haidan 편집자/Guo Xiaojing

베이징 시간으로 7월 30일, NVIDIA(NVIDIA라고도 함)는 미국 덴버에서 열린 최고의 컴퓨터 그래픽 컨퍼런스인 SIGGRAPH 2024에서 렌더링, 시뮬레이션 및 생성 AI 분야의 많은 최신 개발을 시연했습니다.

작년 SIGGRAPH에서 NVIDIA는 GH200, L40S 그래픽 카드 및 ChatUSD를 출시했습니다. 올해의 주인공은 생성 AI 시대의 NVIDIA의 새로운 트럼프 카드입니다."Nvidia NIM" 새로운 업그레이드, NIM을 통해 생성 AI를 USD(Universal Scene Description)에 적용하여 3D 세계에서 AI의 가능성을 넓혀갑니다.

Nvidia NIM 업그레이드: 축복이자 도전

Nvidia는 Nvidia NIM이 AI 모델의 복잡한 배포를 더욱 최적화하고 표준화한다고 발표했습니다. NIM은 NVIDIA AI 레이아웃의 핵심 부분입니다. Huang Renxun은 NIM이 가져온 혁신을 "AI-in-a-Box, 본질적으로 상자 속의 인공 지능입니다.。”

이번 업그레이드는 의심할 여지없이 AI 분야에서 Nvidia의 리더십 위치를 강화하고 기술 해자의 중요한 부분이 됩니다.

CUDA는 오랫동안 GPU 분야에서 Nvidia의 리더십의 핵심 요소로 여겨져 왔습니다. CUDA의 지원으로 GPU는 단일 그래픽 프로세서에서 범용 병렬 컴퓨팅 장치로 발전하여 AI 개발이 가능해졌습니다. 그러나 NVIDIA의 소프트웨어 생태계는 매우 풍부하지만 이러한 단편화된 시스템은 기본적인 AI 개발 기능이 부족한 기존 산업에서는 여전히 너무 복잡하고 마스터하기 어렵습니다.

이 문제를 해결하기 위해 Nvidia는 올해 3월 GTC 컨퍼런스에서 NIM(Nvidia Inference Microservices) 클라우드 기반 마이크로서비스를 출시했으며, AI 애플리케이션 배포를 단순화하고 가속화하기 위해 지난 몇 년 동안 개발된 모든 소프트웨어를 통합했습니다. NIM은 모델을 클라우드, 데이터 센터 또는 워크스테이션에 배포할 수 있는 최적화된 "컨테이너"로 사용할 수 있으므로 개발자는 부조종사, 챗봇 등을 위한 생성 AI 애플리케이션을 쉽게 구축하는 등의 작업을 몇 분 만에 완료할 수 있습니다.

지금까지 Nvidia의 NIM 생태계는 일련의 사전 훈련된 AI 모델을 제공했습니다.엔비디아 발표, 개발자가 여러 영역에서 애플리케이션 개발 및 배포를 가속화하고 다양한 영역(예: 이해,디지털 맨, 3D 개발, 로봇 공학 및 디지털 생물학) 특정 AI 모델 사용 가능:

이해 측면에서 NIM은 Llama 3.1 및 NeMo Retriever를 사용하여 텍스트 데이터의 처리 능력을 향상시킬 수 있으며 디지털 휴먼 측면에서는 고품질 음성 합성 및 자동 자동화를 지원하는 Parakeet ASR 및 FastPitch HiFiGAN과 같은 모델을 제공합니다. 가상 비서와 디지털 인간을 구축하기 위한 음성 인식. 강력한 도구를 제공합니다.

3D 개발 측면에서 USD Code 및 USD Search와 같은 모델은 3D 장면의 생성 및 운영을 단순화하여 개발자가 디지털 트윈 및 가상 세계를 보다 효율적으로 구축할 수 있도록 돕습니다.

로봇 구현 방향에서 NVIDIA는 MimicGen 및 Robocasa 모델을 출시했습니다. 합성 모션 데이터 및 시뮬레이션 환경을 생성하여 로봇 공학의 개발 및 적용을 가속화합니다. MimicGen NIM은 Apple Vision Pro와 같은 공간 컴퓨팅 장치에서 기록한 원격 작동 데이터를 기반으로 합성 동작 데이터를 생성할 수 있습니다. Robocasa NIM은 3D 세계의 개발 및 협업을 위한 범용 프레임워크인 OpenUSD에서 로봇 작업과 시뮬레이션 지원 환경을 생성합니다.

디지털 생물학 분야의 DiffDock 및 ESMFold와 같은 모델은 약물 발견 및 단백질 접힘 예측 분야의 고급 솔루션을 제공하여 생물 의학 연구의 발전을 촉진합니다.

또한 Nvidia는 Hugging Face 추론 서비스 플랫폼도 Nvidia NIM을 기반으로 하며 클라우드에서 실행된다고 발표했습니다.

이러한 다재다능한 모델을 통합함으로써 Nvidia의 생태계는 AI 개발의 효율성을 향상시킬 뿐만 아니라 혁신적인 도구와 솔루션도 제공합니다. 그러나 Nvidia NIM의 많은 업그레이드는 실제로 업계에 "좋은 소식"입니다. 그러나 한편으로는 프로그래머에게 많은 어려움을 안겨주기도 합니다.

Nvidia NIM은 사전 훈련된 AI 모델과 표준화된 API를 제공하여 AI 모델의 개발 및 배포 프로세스를 크게 단순화합니다. 이는 실제로 개발자에게는 큰 이점이지만 향후 일반 프로그래머에게는 취업 기회가 더 줄어들까요? ?결국, 기업은 동일한 작업을 완료하는 데 더 적은 수의 기술 인력을 사용할 수 있습니다. 왜냐하면 이러한 작업은 NIM에 의해 미리 완료되고 일반 프로그래머는 더 이상 복잡한 모델 교육 및 튜닝 작업을 수행할 필요가 없기 때문입니다.

AI에게 3D로 생각하고 가상의 물리적 세계를 구축하도록 가르치세요.

NVIDIA는 또한 SIGGRAPH 컨퍼런스에서 공개 USD 및 Omniverse 플랫폼에 생성 AI 적용을 시연했습니다.

엔비디아는 OpenUSD(Universal Scene Description) 언어, 기하학, 재료, 물리학 및 공간을 이해할 수 있는 세계 최초의 생성 AI 모델을 구축하고 이러한 모델을 엔비디아 NIM 마이크로서비스로 패키징했다고 발표했습니다.현재 Nvidia API 카탈로그에는 미리 볼 수 있는 세 가지 NIM이 있습니다. 공개 USD 지식 질문에 답변하고 공개 USD Python 코드를 생성하는 USD 코드, 개발자가 자연 언어 또는 이미지 입력을 사용하여 방대한 공개 USD 3D를 검색할 수 있도록 합니다. 업로드된 파일이 공개 USD 릴리스와의 호환성을 확인하고 Omniverse Cloud API를 사용하여 완전히 RTX 렌더링된 경로 추적 이미지를 생성하는 이미지 데이터베이스 USD Validate.

엔비디아는 엔비디아 NIM 마이크로서비스를 통한 OpenUSD의 향상과 접근성을 통해 모든 계층이 미래에 물리 기반 가상 세계와 디지털 트윈을 구축할 수 있다고 밝혔습니다. 개방형 USD를 기반으로 하는 새로운 생성 AI와 Nvidia Omniverse 플랫폼에 구축된 Nvidia 가속 개발 프레임워크를 통해 이제 더 많은 산업에서 산업 디자인 및 엔지니어링 프로젝트 시각화를 위한 애플리케이션은 물론 시뮬레이션 환경을 위한 애플리케이션을 개발하여 차세대 물리 AI 및 로봇 구축에 사용할 수 있습니다. . 또한 새로운 USD 커넥터는 로봇 공학 및 산업 시뮬레이션 데이터 형식과 개발자 도구를 연결하여 사용자가 대규모의 완전한 Nvidia RTX 레이 트레이싱 데이터 세트를 Apple Vision Pro로 스트리밍할 수 있도록 해줍니다.

요컨대, 물리적 세계를 더 잘 이해하고 대형 모델을 통해 가상 세계를 구축할 수 있게 해주는 Nvidia NIM을 통한 USD의 도입은 매우 귀중한 자산입니다.디지털 자산 . 예를 들어, 2019년 프랑스 파리의 노트르담 대성당은 심각한 화재를 겪었고 교회의 많은 부분이 파괴되었습니다. 다행히 유비소프트의 게임 디자이너들이 이 건물을 수없이 방문해 구조를 연구하고 노트르담의 디지털 복원을 완료했으며, 3A 게임 '어새신 크리드: 유니티'에서 노트르담을 재현한 모든 디테일도 노트르담 복원에 큰 도움이 됐다. 담 드 파리. 당시 디자이너나 역사가들이 재현하는데 2년이 걸렸지만, 이 기술의 도입으로 앞으로는 대규모 디지털 사본의 복제 속도를 높일 수 있고, AI를 활용해 물리학을 좀 더 세련된 방식으로 이해하고 재현할 수 있다. 방식.

또 다른 예를 들어, 디자이너는 Omniverse에서 기본 3차원 장면을 구축하고 이러한 장면을 사용하여 생성 AI를 조정하여 제어 가능하고 협업적인 콘텐츠 제작 프로세스를 달성합니다. 예를 들어, WPP와 The Coca-Cola Company는 글로벌 광고 캠페인을 확장하기 위해 이 워크플로우를 최초로 채택했습니다.

Nvidia는 또한 개방형 USD 플랫폼에서 개발자의 애플리케이션 기능과 효율성을 더욱 향상시키기 위해 USD 레이아웃, USD 스마트 소재 및 FDB 메시 생성을 포함한 여러 가지 새로운 NIM 마이크로서비스 출시를 발표했습니다.

이번에 NVIDIA Research는 20개 이상의 논문을 가지고 컨퍼런스에 참여하여 합성 데이터 생성기 및 역렌더링 도구의 개발 촉진과 관련된 혁신적인 결과를 공유했으며, 그 중 2개는 Technical Best Paper Award를 수상했습니다. 올해 발표된 연구에 따르면AI는 이미지 품질을 개선하고 3D 표현의 새로운 방법을 열어 시뮬레이션 기능을 더욱 향상시킵니다. ;또한 합성 데이터 생성 기능이 향상되고 AI 수준이 더욱 향상되었습니다. 이 연구는 AI 및 시뮬레이션 분야에서 Nvidia의 최신 발전과 혁신을 보여줍니다.

Nvidia는 이제 디자이너와 아티스트가 허가된 데이터에 대해 훈련된 생성 AI를 사용하여 생산성을 향상할 수 있는 새로운 방법을 갖게 되었다고 말합니다. 예를 들어, Shutterstock(미국 이미지 공급업체)은 생성 3D 서비스의 상용 베타 버전을 출시했습니다. 이를 통해 제작자는 신속하게 3D 자산의 프로토타입을 만들고 360개의 HDRi 배경을 생성하여 텍스트나 이미지 프롬프트만 사용하여 장면을 밝힐 수 있으며, Getty Images(미국 사진 교환 회사)는 생성 AI 서비스를 가속화하여 이미지 생성 속도를 두 배로 향상시켰습니다. 다중 모드 생성 AI 아키텍처인 Nvidia Edify를 기반으로 하는 이 서비스는 새로운 모델로 속도를 두 배로 높이고, 이미지 품질과 즉각적인 정확도를 향상시키며, 사용자가 피사계 심도나 초점과 같은 카메라 설정을 제어할 수 있도록 해줍니다. 사용자는 약 6초 안에 4개의 이미지를 생성하고 이를 4K 해상도로 확장할 수 있습니다.

결론

Huang이 등장하는 모든 주요 행사에서 그는 항상 가죽 재킷을 입고 AI가 가져올 흥미진진한 미래를 세상에 설명합니다.

우리는 또한 NVIDIA의 성장을 경험하고 있습니다. NVIDIA는 게임용 GPU 거대 기업에서 AI 칩 대군주로, 그리고 수직 및 수평 AI 소프트웨어와 하드웨어의 풀 스택 레이아웃으로 단계적으로 성장하고 있습니다. NVIDIA는 야망으로 가득 차 있으며 빠르게 반복됩니다. AI 기술 물결의 최전선에 서다.

프로그래밍 가능한 셰이딩 GPU, CUDA 가속 컴퓨팅부터 Nvidia Omniverse 및 생성 AI NIM 마이크로서비스 출시, 3D 모델링, 로봇 시뮬레이션 및 디지털 트윈 기술 개발 촉진에 이르기까지 이는 AI 분야의 새로운 혁신을 의미합니다. 산업이 다가오고 있습니다.

하지만 대기업은 자본, 기술, 인력 등 더 많은 자원을 보유할수록 Nvidia NIM과 같은 첨단 기술을 더 빠르게 채택하고 구현할 수 있습니다. 제한된 자원으로 인해 중소기업은 기술 개발 속도를 따라잡는 데 어려움을 겪을 수 있습니다. 인재의 기술 수준 차이와 맞물려 향후 기술 불평등이 더욱 심화될 것인가?

인류의 이상적인 AI는 인간이 손과 노동을 자유롭게 하여 생산성이 더 높은 세상을 만드는 것입니다. 하지만 생산성과 생산수단이 소수의 사람들에 의해 통제된다면 더 큰 위기를 촉발할 것인가? 이것들은 모두 우리가 생각해야 할 질문입니다.