소식

Xiao Zha와 Lao Huang은 옷을 갈아입으며 친밀한 노변 대화를 나눕니다!Xiao Zha는 실제로 방폭 두께를 깨뜨렸고 Lao Huang은 Blackwell의 첫 번째 배치가 출시되었다고 밝혔습니다.

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


새로운 지혜 보고서

편집자: 편집부

[새로운 지혜 소개] 방금 Lao Huang은 SIGGRAPH 컨퍼런스에서 다음과 같이 밝혔습니다. Blackwell의 엔지니어링 샘플이 이번 주에 공식적으로 전 세계로 전송되었습니다! 이후 라오황과 샤오자는 노변에서 대화를 나누며 친밀하게 옷을 교환했고, 흥분되는 지점에 이르렀을 때 샤오자는 너무 화가 나서 폭발했다.

속보가 왔습니다!

방금 Lao Huang은 SIGGRAPH 컴퓨터 그래픽 컨퍼런스에서 다음과 같이 밝혔습니다. 바로 이번 주에 NVIDIA는 Blackwell 엔지니어링 샘플을 전 세계에 보내기 시작했습니다!

그 직후 진행자 Lauren Goode는 다음과 같이 농담했습니다. 예, 모두 고개를 숙이고 의자 아래에 있습니다.

오늘날 가장 강력한 AI 칩 뒤에는 AI도 분리될 수 없다는 점을 언급할 가치가 있습니다.

AI가 없었다면 Hopper는 불가능했을 것이고, AI가 없었다면 Blackwell도 불가능했을 것입니다.


샤오자와의 노변 대화에서 샤오자는 감정이 격해진 어느 순간 욕을 하지 않을 수 없었다.

두 상사의 이전 의상 변화의 효과는 정말 말로 설명하기 어렵기 때문입니다.

이번에 샤오자는 노황에게 맞춤형'블랙 가죽 스타일' 면 코트를 특별히 선물했다.


상체를 찍은 후 효과가 정말 뛰어납니다!


물론 샤오자도 라오황에게 2시간만 입었던 '중고' 가죽 재킷을 입었다. (신품보다 훨씬 가치가 높습니다.)


NVIDIA의 디지털 "복제본" 세계

컨퍼런스에서 Lao Huang은 NVIDIA가 OpenUSD(언어, 기하학, 재료, 물리학 및 공간)를 이해할 수 있는 세계 최초의 생성 AI 모델을 구축했다고 발표했습니다.

OpenUSD란 무엇입니까? 보편적인 장면 묘사(Universal Scene Description)로 이해될 수 있는 보편적 장면 묘사(Universal Scene Description)를 말한다.

Huang은 AI가 텍스트로 할 수 있는 것보다 더 흥미로운 것은 우리도 이미지로 동일한 작업을 수행할 수 있다는 것이라고 말했습니다.

예를 들어 엔비디아가 만든 Edify AI 모델은 텍스트부터 2D까지 기본 모델이다.


브랜드의 경우 코카콜라, 자동차, 명품 등을 만들 수 있습니다. 그러나 단서를 제어하는 ​​것은 어려운 일입니다.

이는 단어의 위도가 매우 낮고 내용이 극도로 압축되어 있지만 동시에 매우 부정확하기 때문입니다.

NVIDIA는 이를 수행하는 방법을 만들었습니다. 즉, 다른 모델을 생성하고 이를 제어하고 더 많은 조건에 맞게 정렬을 조정하는 것입니다.


Omniverse를 사용하면 3D, AI, 애니메이션, 소재 등 모든 다중 모드 데이터와 콘텐츠를 결합할 수 있습니다.

우리는 자세, 위치 등을 간단히 말해서 원하는 대로 변경할 수 있습니다.

Omniverse에서 조건부 프롬프트를 사용하는 것은 검색 강화 생성과 마찬가지로 일종의 3D 강화 생성으로 이해될 수 있습니다.

이렇게 하면 우리가 원하는 방식으로 이미지를 생성할 수 있습니다.

다음으로 WPP는 셔터스톡을 이용해 세계 유명 브랜드와의 작품을 완성해 관객들에게 직접적인 충격을 안겼다.

분주한 식당의 빈 방에 테이블을 만들어 주세요. 그 주위에는 의자가 놓여 있습니다.


아침 햇살에 타코와 살사 한 그릇이 담긴 테이블을 만들어주세요.


나무로 둘러싸인 빈 도로, 현대식 집 근처에서 자동차를 만들어 보세요.


빈 들판에 나무를 세워주세요.


사방으로 수백 그루의 나무를 지어주세요.


숲을 덤불과 덩굴로 장식하십시오.


이국적인 꽃과 햇빛으로 가득한 거대한 열대우림을 만들어주세요.


Omniverse는 이제 텍스트를 USD로 변환하는 것을 이해합니다. 텍스트를 이해하고 의미론적 데이터베이스를 갖추고 있어 모든 3D 개체를 검색할 수 있습니다.

따라서 어린 소녀는 3D 나무를 어떻게 채우고 싶은지 상상할 수 있고, 일단 완성되면 3D 장면은 생성 AI 모델로 들어가 이를 사실적인 모델로 변환합니다.

그때부터 사람들이 이러한 시뮬레이션, 즉 디지털 트윈을 만드는 데 도움을 주기 위해 점점 더 많은 생성 AI가 Omniverse에 등장하게 될 것입니다.

예를 들어, 다음과 같은 디지털 AI를 통해 모든 기업은 고객 서비스를 제공할 수 있습니다.

지금은 고객 응대를 사람이 대행하지만, 앞으로는 AI가 참여할 것이다.

고객 서비스는 IO인 디지털 휴먼 프런트 엔드에 연결됩니다. 이 IO는 우리와 대화하고 눈을 마주칠 수 있습니다.


이 디지털 휴먼에는 모든 종류의 AI가 연결될 수 있으며, 심지어 디지털 휴먼도 엔비디아의 검색이 강화된 고객 서비스 AI에 연결될 수 있습니다.

NIM 서비스

이번 컨퍼런스에서 NVIDIA는 새로운 NIM 마이크로서비스 세트를 출시했습니다.

NIM은 OpenUSD, 3D 모델링, 물리학, 재료, 로봇 공학, 산업용 디지털 트윈 및 물리학 AI를 포함한 다양한 워크플로우에 맞게 조정되었습니다.

AI 및 그래픽 분야에서 NVIDIA는 물리적 AI 애플리케이션 생성을 위해 설계된 새로운 OpenUSD NIM 마이크로서비스를 출시했습니다.

이 워크플로우에는 로봇 시뮬레이션을 위한 새로운 NIM 마이크로서비스와 휴머노이드 로봇 개발을 가속화하기 위한 다양한 기능이 포함되어 있습니다.

"3체"로 로봇을 만든다

황은 AI의 다음 물결은 물리적 AI가 될 것이라고 예측했다.

로봇 공학 기술이 발전하려면 고급 AI와 현실적인 가상 세계가 필요하며, 차세대 휴머노이드 로봇이 배포되기 전에 AI를 훈련해야 합니다.

로봇공학에는 세 대의 컴퓨터가 필요합니다. 하나는 AI를 훈련하기 위한 컴퓨터이고, 다른 하나는 물리적으로 정확한 시뮬레이션에서 AI를 테스트하기 위한 컴퓨터이며, 다른 하나는 로봇을 최적화하는 방법을 배울 수 있는 로봇 자체 내부에 있습니다.


즉, 제3의 AI는 실제로 AI를 실행하는 컴퓨터이다.

이를 위해 Nvidia는 세 대의 컴퓨터를 만들었습니다.

AI가 없으면 H100/H200, B100도 없습니다.

1990년대부터 시작된 NVIDIA의 역사에서 진정한 DNA는 컴퓨터 그래픽에 있습니다.

컴퓨터 그래픽은 또한 Nvidia를 오늘날의 위치로 가져왔습니다.


이 그림은 IMB 360 시스템, Utah Teapot, 광선 추적, 프로그래밍 가능한 음영 처리 등을 포함하여 컴퓨터 산업의 몇 가지 중요한 이정표를 보여줍니다.

1993년 엔비디아가 설립되었습니다. 8년 후, 그들은 Nvidia의 개발 역사를 크게 이끈 최초의 프로그래밍 가능 셰이딩 GPU를 발명했습니다.

NVIDIA가 하는 모든 일의 핵심은 가속 컴퓨팅이라고 할 수 있습니다. 그들은 범용 컴퓨팅을 강화하는 컴퓨팅 모델을 만들면 일반 컴퓨터가 해결할 수 없는 문제를 해결할 수 있다고 굳게 믿었습니다.

선호하는 분야는 컴퓨터 그래픽입니다. 그들은 올바른 내기를 했습니다.

당시 비주류 분야인 3D 그래픽 비디오 게임에 컴퓨터 그래픽을 적용한 것은 엔비디아의 플라이휠을 직접적으로 홍보했습니다.

그 후 CUDA를 유비쿼터스화하는 데 오랜 시간이 걸렸고, 2012년에 스타트렉처럼 NVIDIA가 처음으로 AlexNet에 접근했습니다.

2012년은 폭발적인 순간이었습니다. AlexNet은 컴퓨터 비전 분야에서 놀라운 혁신을 이루었습니다. 핵심 - 딥 러닝은 매우 심오하여 엔지니어는 더 이상 입력을 제공한 후 출력이 어떻게 보일지 상상할 필요가 없습니다.


2016년 Nvidia는 Musk가 선호했던 최초의 딥 러닝용 컴퓨터인 DGX-1을 출시했습니다. 이후 이 제품은 당시 잘 알려지지 않은 OpenAI에 전달되었습니다.

이후 RTX와 DLSS가 발명되었습니다.

그런 다음 ChatGPT가 탄생했습니다.

미래에는 누구나 AI 비서를 갖게 될 것이다

오늘날 우리는 AI를 사용하여 단어뿐만 아니라 이미지, 비디오, 3D, 화학, 단백질, 물리학, 열역학, 유체 역학, 입자 물리학 등 모든 것을 배우는 방법을 배웠습니다.


우리는 이러한 다양한 양식의 의미를 이해합니다.

Lao Huang의 관점에서는 비주얼 컴퓨팅을 기반으로 한 생성적 AI 혁명이 인간의 창의성을 향상시키고 있습니다.

우리는 소프트웨어 3.0 시대를 향해 나아가는 진정한 혁명의 순간에 있습니다. 어떤 산업도 AI의 영향에서 벗어날 수 없습니다!


황은 다음과 같이 예측했습니다. 모든 사람이 AI 비서를 갖게 될 것이며, 모든 회사와 회사 내의 모든 업무가 AI의 지원을 받게 될 것입니다.


컴퓨팅을 가속화하여 에너지 문제 해결

생성적 AI는 인간의 생산성을 향상시킬 것으로 기대되지만, AI 인프라의 에너지 소비는 지구 전체를 괴롭히는 주요 문제입니다.

ChatGPT 한 번의 검색은 Google 검색 10번의 힘과 동일합니다.

데이터 센터는 전 세계 총 에너지의 1~2%를 소비하며, 10년 내에 6%에 도달할 수도 있습니다.


무엇을 해야 할까요? Lao Huang이 해결책을 가지고 있습니다.

그는 가속 컴퓨팅 기술이 컴퓨팅을 더욱 에너지 효율적으로 만들 것으로 기대한다고 말했습니다.

"가속 컴퓨팅은 우리가 많은 에너지를 절약하는 데 도움이 될 수 있습니다. 20배 또는 50배를 절약하고 동일한 처리를 수행할 수 있습니다"라고 Huang은 말했습니다.

"사회로서 우리가 가장 먼저 해야 할 일은 가능한 모든 적용을 가속화하는 것입니다. 이를 통해 전 세계에서 사용되는 에너지의 양이 줄어듭니다."

동일한 에너지를 사용하면서도 애플리케이션 속도를 크게 높여주는 블랙웰이 기대되는 이유다.

그리고 점점 더 저렴해지고 있어요.


Lao Huang은 다음과 같이 강조했습니다. 생성 AI의 목표는 훈련이 아니라 추론이라는 점을 기억하세요. 이상적으로 추론을 통해 날씨 예측, 신소재 예측, 공급망 최적화 등을 위한 새로운 모델을 만들 수 있습니다.

기억하세요. 데이터 센터는 에너지를 소비하는 유일한 장소가 아닙니다. 글로벌 데이터 센터는 전체 컴퓨팅의 40%만을 차지하고 에너지 소비의 60%는 전자, 비트 및 바이트를 이동하는 온라인에서 발생합니다.

따라서 생성적 AI는 정보를 검색할 필요가 없고 현장에서 직접 생성할 수 있기 때문에 온라인에서 에너지 소비를 줄입니다.


그리고 바로 지금 Nvidia는 Pandas를 실행하기 위해 GCP에 GPU를 배포했습니다.

세계 최고의 데이터 사이언스 플랫폼은 일반 컴퓨팅을 뛰어넘어 속도를 50배에서 100배로 직접적으로 높였습니다.

지난 10~12년 동안 딥러닝 속도를 100만 배로 높이고 비용과 에너지 소비를 100만 배로 줄였습니다. 이것이 LLM이 탄생한 이유입니다.

그러나 NVIDIA는 새로운 프로세서, 새로운 시스템, Tensor 코어 GPU 및 NVLink 스위치 구조를 설계하여 AI에 새로운 혁신을 가져올 것입니다.

Lao Huang과 Xiao Zha의 노변 대화


올해 SIGGRAPH에서 두 CEO가 나누는 노변담화는 많은 사람들이 오랫동안 기다려왔습니다. Xiao Zha 자신의 말에 따르면 "업계에서 가장 선배인 두 창업자"는 어떤 불꽃이 충돌하게 될까요?

다음 물결

당연히 '청매실요리술'의 두 주인공은 각자의 예측을 공유하며, GenAI부터 Agent, Xiao Zha가 늘 고민해온 'Metaverse'까지 미래 기술 발전 동향에 대해 이야기를 나눴습니다.

황 씨는 GenAI의 기술력에 충격도 받았다고 말했다. “이렇게 빠른 속도로 소비자, 기업, 산업계, 학계에 영향을 미치고 기후 기술부터 생명공학, 모든 분야에 영향을 미친 기술은 기억나지 않습니다. 물리학의 다양한 분야.”

Xiao Zha는 또한 GenAI가 Meta의 다양한 소셜 미디어 소프트웨어를 재구성할 가능성이 높다고 말했습니다.

과거에는 이들 상품의 핵심인 추천 시스템이 단지 사용자가 관심을 갖는 콘텐츠를 푸시하는 것뿐이었습니다.

하지만 GenAI는 더 이상 기존 콘텐츠에만 국한되지 않고 창작자를 지원할 뿐만 아니라 사용자를 위한 실시간 콘텐츠를 생성하거나 기존 콘텐츠를 합성하여 생성합니다.


Agent 개발에 관해서는 두 사람의 의견이 비슷한 것 같습니다.

황 회장은 이전 연설에서 "미래에는 모든 사람이 자신만의 AI 비서를 갖게 될 것"이라고 분명히 밝혔습니다.

이 대화에서 샤오자(Xiao Zha)도 비슷한 비전을 표현했다. 그는 모든 사람이 다양한 목적에 맞게 자신만의 에이전트를 만들 수 있도록 메타용 AI 비서 및 AI Studio 제품을 계획하고 있습니다.

오늘날 모든 회사가 자체 소셜 미디어와 이메일 계정을 갖고 있는 것처럼 미래에는 모든 회사가 자체 AI를 갖게 될 것입니다.

그들이 말하는 "AI 비서"는 얼마나 "지능적"이어야 합니까?

지금까지 우리가 본 Llama 3는 인간의 질문에만 응답할 수 있는 "챗봇"과 유사한 언어 모델일 뿐입니다. 그러나 Xiao Zha는 AI에 "의도"가 부여될 수 있기를 바라고 있습니다.


Lao Huang은 이를 인간처럼 마음 속에 '의사결정 나무'를 형성하고 행동을 안내할 수 있는 '계획 능력'이라고 설명했습니다.

그는 이런 종류의 AI 비서 비용이 시간당 10달러에 불과하지만 엔지니어의 업무 성과를 크게 향상시킬 수 있다고 과감하게 예측했습니다. "아직 AI 채용을 하지 않았다면 지금 채용하세요!"

Meta의 핵심이자 가장 독특한 AR/VR 기술과 관련하여 Xiao Zha의 청사진도 매우 정확하여 그의 강박적인 성격을 완벽하게 반영합니다.

(라오황의 소식에 따르면 토마토는 밀리미터 단위의 정밀도로자를 수 있으며 토마토 조각은 서로 닿을 수 없습니다.)

지난해 9월 메타와 레이밴은 오디오 장비와 카메라를 탑재한 새로운 스마트 안경을 출시해 사용자가 양쪽 눈의 시점에서 직접 사진을 찍거나, 안경에 보이는 시야를 페이스북이나 페이스북으로 직접 생중계할 수 있다. 인스타그램, 대화 도우미 Meta AI를 통합했습니다.


샤오자는 현재 레이밴 안경 상황을 보면 300달러대 비디스플레이 AI 안경이 큰 인기를 끌 것이라고 말했다.

그의 예측에 따르면, 미래에는 스마트 안경이 휴대폰과 같은 기기가 될 것이며, 안경을 쓰는 사람은 누구나 스마트 안경을 착용하게 될 것이다(전 세계적으로 10억 명 이상).

앞으로 몇 년 안에 메타는 홀로그램 AR 기능을 탑재한 안경도 출시할 예정이다. 아직 가격은 비싸지만 실현 가능한 제품이 될 것이다.


스마트 안경과 달리 혼합 현실 헤드셋은 워크스테이션이나 게임 콘솔과 더 유사합니다. 휴대가 편리하지는 않지만 컴퓨팅 성능이 더 강력하고 사용자에게 더욱 몰입도 높은 경험을 제공할 수 있습니다.

더욱이 홀로그램 AR 기술의 발전으로 '가상 회의'도 머지않아 현실이 될 전망이다.

Zoom 플랫폼의 아바타나 비디오와는 달리, 모든 사람은 자신만의 홀로그램 이미지를 갖게 됩니다. 비록 서로 다른 물리적 공간에 있더라도 홀로그램으로 만들어진 "가상 사람들"은 같은 공간에서 협업하고 상호 작용할 수 있습니다.

오픈소스가 앞으로 나아갈 길이다

메타에 있어서는 그들의 일관된 '오픈소스' 전략도 반드시 논의해야 할 핵심 포인트다.

Lao Huang은 이 전략을 매우 높이 평가했습니다. 그는 작년에 Llama 2가 AI 분야에서 가장 중요한 이벤트가 될 수 있다고 말했습니다. PyTorch 및 새로 출시된 Llama 3.1과 결합하여 Meta는 전체 생태계를 구축했습니다.

그러나 Xiao Zha는 오픈 소스로의 길도 일종의 "적응"이라고 말했습니다.

많은 트랙, 특히 분산 컴퓨팅 시스템 및 데이터 센터에서 Meta의 출발선은 실제로 다른 회사보다 뒤떨어져 있으므로 팀은 오픈 소스, 특히 오픈 컴퓨팅을 생각했습니다.

의외로 이 편법이 '코너 추월'의 핵심 전략이 됐다.

Meta가 출시하는 제품을 업계 표준으로 만들고 전체 공급망이 이를 중심으로 구축되는 것은 오픈 소스입니다. Meta는 프로젝트를 오픈 소스로 만들어 수십억 달러를 절약하기도 했습니다.

예를 들어 메타(Meta)는 실제로 대부분의 기업보다 GPU 분야에 늦게 진출했지만, 현재 그들이 운영하고 있는 GPU 슈퍼컴퓨팅 클러스터의 규모는 거의 모든 경쟁사를 뛰어넘는다.

물론, 여기에는 Lao Huang의 강력한 지원이 필수적입니다. Meta의 60만 GPU도 Nvidia에서 만든 것입니다.


오픈 소스가 이 커뮤니티와 산업의 발전을 촉진할 수 있지만 Xiao Zha도 오픈 소스는 자선 단체가 아니며 사심 없는 마음 때문에 이 전략을 선택하지 않았다고 솔직하게 말했습니다.

더 중요한 목적은 만들어지는 제품을 최고조에 이르게 하고, 최고의 제품이 되도록 만드는 것입니다.

PyTorch가 가장 전형적인 예입니다. NVIDIA의 엔지니어 200~300명을 포함한 전 세계 개발자들은 이 오픈 소스 프레임워크가 버그를 찾고 최적화하도록 돕고 있으며, Huang이 "PyTorch 엔지니어링 산"이라고 부르는 것을 형성하고 있습니다.

Xiao Zha 자신도 오픈소스가 이기적이라는 점을 인정하지만 여전히 "폐쇄형" 플랫폼에 대해 이야기할 때 감정이 격해지지 않을 수 없습니다. 방 안의 유일한 욕설은 이 주제에서 나왔습니다.

Meta에는 수많은 최고 수준의 소셜 소프트웨어가 있지만 이러한 애플리케이션은 경쟁사의 플랫폼, 특히 Apple App Store 및 Google의 Android 시스템을 통해 배포되어야 합니다.

Xiaozha를 매우 짜증나게 만드는 것은 한때 많은 제품 아이디어가 있었지만 이러한 모바일 플랫폼의 다양한 한계로 인해 결국 성공하지 못했다는 것입니다.

모바일 인터넷 시대의 극단적인 플랫폼 의존도는 PC 시대의 개방성과 전혀 다르기 때문에 샤오자는 웹상의 페이스북을 그리워하게 된다.


따라서 그는 우리가 오픈 소스 소프트웨어가 더 큰 가치를 회복할 차세대 컴퓨팅 플랫폼, 즉 혼합 현실 기술을 형성하고 있다고 자신있게 말했습니다.

차세대 플랫폼과 생태계는 완전히 폐쇄적인 Apple이 아닌 이전 Windows 또는 Android 생태계와 유사하게 더 개방적이고 포용적일 것입니다.

"오픈 소스를 다시 위대하게 만들겠다"는 야망은 사람들에게 Llama 3.1이 출시되었을 때 그의 비유를 상기시킵니다. Llama 3.1은 이 시대의 Linux입니다.

CEO가 되기는 쉽지 않다

대화를 나누는 내내 두 사람은 서로에게 상당한 공감을 느꼈고, CEO라는 직업의 어려움에 대해 자주 이야기를 나눴다.

가죽 재킷을 입은 61세의 젠슨은 진지한 얼굴로 자신을 섬세한 꽃에 비유하기도 했다. "우리는 CEO입니다. 섬세한 꽃처럼 우리에게도 많은 지원이 필요합니다."

샤오자는 "우리 지금 너무 초췌하다"고 덧붙였다.

이러한 감정은 두 명의 고위 창립자가 회사에서 경험한 우여곡절에서 비롯되었을 수 있습니다.

Xiao Zha의 관점에서 Lao Huang은 선호받지 못한다는 압력을 견디고 컴퓨터를 "슈퍼 거물"로 만들 것을 주장하여 Nvidia를 업계 전설로 만들었습니다.

Lao Huang의 관점에서 Xiao Zha는 Meta가 PC에서 모바일로, 소셜 미디어에서 VR/AR 및 AI 연구로 많은 변화를 겪도록 이끌었습니다.

대화 말미 황씨는 "그거(변신)하는 게 얼마나 어려운지 안다. 우리 둘 다 큰 타격을 입었지만 선구자가 되고 혁신을 이루기 위해서는 이것이 필요하다"고 두 사람의 유사점을 직설적으로 말했다. .

참고자료:

https://www.youtube.com/watch?v=H0WxJ7caZQU

https://www.youtube.com/watch?v=w-cmMcMZoZ4