소식

NVIDIA는 어려운 시기를 맞이했습니다. 왜 우리는 여전히 낙관적인가요?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

텍스트 | Shidao, 저자 | Shidao AI 그룹, 편집자 |

최근 NVIDIA가 어려움을 겪고 있는데, 정말 큰 일입니다.

첫 번째는 '외국의 침략'이다. 끊임없는 '작은 움직임'으로 인해 회사는 미국 법무부의 독점 금지 조사를 받고 있다.

두 번째는 '내부 걱정'이다. 제품 설계 오류로 인해 새로운 블랙웰 칩의 출하 시기가 3개월 정도 지연될 예정이다.

지난주 Nvidia의 주가는 롤러코스터를 탔습니다. 화요일에는 7% 하락했고, 목요일에는 거의 13% 급등했으며, 금요일에는 거의 7% 하락했습니다.변동성만 봐도 엔비디아가 비트코인을 앞질렀습니다.30일 옵션의 내재 변동성은 최근 48%에서 71%로 급등한 반면, 비트코인 ​​DVOL 지수는 68%에서 49%로 하락했습니다.

잘 알려진 헤지 펀드 Elliott는 투자자들에게 다음과 같이 말했습니다. Nvidia는 "거품"에 있고 AI 기술은 과장되었습니다. 이 기관은 Nvidia의 최대 고객이 자체 칩을 개발하고 있으며 거대 기업이 계속해서 Nvidia의 GPU를 대량 구매할 것인지 의문을 제기했다고 밝혔습니다. 버블은 언제 터질까? Elliott는 Nvidia의 재무 결과가 좋지 않으면 파산이 발생할 수 있다고 믿습니다.

엔비디아가 "어려운 시기"에 진입하고 있다는 것은 부인할 수 없지만, "사방에서 전투"를 하기에는 아직 이르다.

Supervision은 특히 NVIDIA의 "7인치"를 목표로 하며 꾸준하지만 무자비하지는 않습니다.

7월 초, 프랑스는 NVIDIA를 상대로 첫 번째 반독점 공격을 가했습니다. 그 후 몇 주 동안 Nvidia는 미국 법무부의 표적이 되었습니다.

The Information은 미국 법무부의 수사관들이 모든 사람의 고발을 수집하기 위해 Nvidia의 "반대자"와 "고객"의 집을 방문했다고 보도했습니다.

주장 1: NVIDIA는 고객을 위협합니다.AMD 칩을 구입하면 Nvidia가 가격을 인상하거나 원래 약속했던 GPU 출하량을 줄일 수도 있습니다.

혐의 2: Nvidia가 네트워크 케이블 및 랙을 강제 배포했습니다.가장 큰 피해를 입은 사람들은 다음과 같습니다: Microsoft, Google, Amazon...

한번은 마이크로소프트가 우선 배송권을 얻기 위해 이를 악물고 Nvidia의 네트워크 케이블을 구입한 적이 있습니다. 2023년 초 결산이 이루어졌을 때 Nvidia에 지불한 돈의 1/3이 이러한 "에지" 제품에 지출된 것으로 밝혀졌습니다. . Nvidia의 네트워크 케이블 매출은 32억 달러로 3배 이상 증가하여 전체 데이터 센터 매출의 14%를 차지하는 것으로 보고되었습니다.

오늘 엔비디아 부사장 앤드류 벨(Andrew Bell)도 "이 선반을 구입하는 사람은 누구든지 GB200을 얻는 우선권을 갖게 될 것"이라고 말했습니다.
Microsoft는 몇 주 간의 "싸움" 끝에 재난을 피했지만 Amazon과 Google은 모두 강압으로 인해 동의했습니다.

세 번째 주장: Nvidia가 Run:ai를 인수했습니다.이번 거래는 올해 4월 말 공식 발표됐으며, 구매 가격은 7억 달러에 달한다.

Run:ai는 GPU에서 AI 애플리케이션과 워크로드를 단순화하여 AI 칩의 효율성을 높이는 데 주력하는 이스라엘 스타트업으로, 결과적으로 작업을 완료하는 데 필요한 Nvidia GPU 수를 줄이는 데 도움이 됩니다.

Nvidia가 Run:ai의 기능을 기존 제품에 통합한 것은 상대방이 사용할 가능성을 "죽일" 뿐만 아니라,또한 DGX 및 DGX Cloud 도달 범위도 확대되었습니다.

Lao Huang Zaoyun은 "NVIDIA가 Cisco가 되는 것을 피하기 위한 '좋은 휴양지'입니다." 하나는 클라우드 및 소프트웨어 비즈니스가 매년 수십억 달러를 창출한다는 것입니다. 두 번째는 Nvidia가 칩을 보완하는 서비스를 개발할 수 있는 "모든 수단"을 갖추고 있다는 것입니다.

위에서 언급한 "엄격한 GPU 할당", "상품 유통 및 강제 구매 및 판매", "클라우드 및 생태계 구축" 등 모두 NVIDIA 제국을 통합하려는 Huang Renxun의 "힘든 움직임"입니다. 장기적. 결국, 그의 목표는 전 세계 모든 회사가 Nvidia AI Enterprise에서 운영되는 것입니다.

따라서 미국 법무부의 이번 조사는 '안정적이고 정확하다'고 표현될 수 있으며 엔비디아의 '7인치'에 타격을 입힐 수 있다.

그러나 "무자비한지 아닌지"는 또 다른 문제입니다. 결국, 독점금지 조사는 수년간 지속되는 경우가 많으며, 정부는 궁극적으로 대상 회사를 기소하지 않을 수도 있습니다. 소송이 시작되더라도 소송이 종결되기까지 수년이 걸릴 수 있습니다.

예를 들어 2020년 구글 검색 독점금지 사건은 올해에만 재판이 열렸는데, 해당 사건을 담당한 판사는 아직 판결을 내리지 않았다.

정리하자면, 이번 독점금지 조사는 치열하고 신속하게 이뤄지지만 GPU 제국의 근간을 훼손할 수는 없을 것으로 보인다.

Nvidia에는 ​​두 가지 직접적인 영향이 예상됩니다.

첫째, 향후 인수에 영향을 미칩니다. 예를 들어, 2021년 FTC는 Nvidia가 SoftBank로부터 Arm을 인수하기 위해 400억 달러를 지출하는 것을 막기 위해 독점 금지 소송을 제기했습니다. 지금 보면 손정의가 FTC 덕분에 다시 살아날 수 있다.

두 번째는 '대군주 합의'를 단속하는 것이다. 결국 표적이 되었고, 엔비디아의 '작은 움직임'은 억제될 수도 있다.

엔비디아는 흔들리고 글로벌 AI 개발은 둔화된다

Nvidia 제품의 '내부 우려'에 대해 이야기해 보겠습니다.

보고서에 따르면,엔비디아의 B100과 B200 모델은 설계 결함으로 인해 취소됐고, 이후 주문 수량의 20% 수준으로 배송됐고, 이후 B200A로 업그레이드돼 내년 중순부터 배송이 시작될 예정이다.

그러나 현재 GB200의 진행은 지연되지 않습니다. '최강의 왕' GB200은 단순한 칩이 아닌 두 개의 B200 칩을 결합한 강력한 플랫폼이다. (1GB200에는 Grace CPU 1개 + B200 2개가 포함됩니다.)

B100 자체에 대한 시장 수요는 크지 않고, 고객사도 B100에서 B200(45만대 이상 수요)으로 이동한 것으로 알려졌다.

일부 기관의 피드백에 따르면 현재 해결책은 H200을 사용하여 격차를 먼저 메우는 것입니다.엔비디아는 3분기에 H200을 주로 출시할 예정이며, 10월과 11월에는 일부 H200을 고객사에 추가할 예정이며 늦어도 12월까지는 모든 것이 정상화될 예정이다.

이러한 지연으로 인해 Meta, Google, Microsoft와 같은 주요 고객의 배포 계획이 중단되고 생성 AI, 비디오 처리 및 기타 AI 애플리케이션을 포함하여 Nvidia의 AI 칩을 사용하는 제품 및 서비스의 개발 진행에 영향을 미칠 수 있습니다.

즉, 분석가들이 "NVIDIA 버블"을 외쳐도 NVIDIA에 문제가 발생하면 글로벌 AI 개발 프로세스가 느려질 것입니다.

즉, NVIDIA 버블이 곧 터질 것이라는 것을 증명하고 싶거나, AI 버블이 곧 터질 것이라는 것을 증명하고 싶거나, GPU에 대한 시장 수요가 둔화되고 있음을 증명하고 싶거나, NVIDIA의 경쟁이 치열하다는 것을 증명하고 싶다면; 제품이 빛나기 시작합니다.

그러나 현재로서는 히트의 증거를 제공할 수 없습니다.

Nvidia에 대해 긍정적인 이유

첫째, AI 버블이 곧 터질 것인가? 아니요.

가장 '비관적인' 상사이자 최고의 국제 출판물의 신인 '달롱 교수' 다론 아세모글루는 AI가 향후 10년 안에 생산성을 약 0.53%~0.66% 높이고, GDP를 약 0.9% 늘릴 것이라고 믿고 있다.

Goldman Sachs의 글로벌 주식 리서치 책임자인 Jim Covello도 상당히 비관적입니다. AI는 수익이 약 1조 달러에 달하는 지출을 초과하기 전에 복잡한 문제를 해결할 수 있어야 합니다.AI 버블에 대해서는 터지기까지 오랜 시간이 걸릴 수 있다는 게 코벨로의 견해다.

동시에 Morgan Stanley와 Wall Street의 "TMT King" Coatue는 AI의 전망에 대해 매우 낙관적입니다.

모건스탠리는 현재 AI 인프라 투자 붐이 초기 단계에 있으며 아직 1999년 인터넷 버블 수준에 도달하지 못했다고 보고 있다. 특히 GPU 투자는 이제 막 시작됐다.

Coatue는 AI가 과대 광고가 아니며 황금 시대가 아직 도래하지 않았다고 믿습니다. AI는 가치 평가 거품이 아니라 주로 거인을 위한 게임입니다.

둘째, GPU가 이미 가득 찼습니까? 아니요.

Sequoia와 a16z의 전투는 다음과 같습니다.

세쿼이아는 GPU 공급 부족 사태가 최고조에 달했다고 믿고 GPU를 '욕설'했고, GPU 구매로 인한 AI 업계의 매출 격차가 5000억 달러에 달한다고 계산했다.

반면, a16z는 수천 개의 GPU를 비축하기 위해 수억 달러를 지출했을 뿐만 아니라 '산소 프로젝트'를 세간의 이목을 끄는 방식으로 시작하여 궁극적으로 GPU 클러스터 규모를 더 많은 규모로 확장할 계획입니다. 20,000개 이상의 단위.

어떻게 실용적인가요? 우리 생각을 바꿔보는 건 어떨까요?

기존의 사고 방식은 모델이 강력하고 킬러 애플리케이션이 등장한다는 것입니다. 컴퓨팅 성능에 대한 수요가 클수록 GPU에 대한 수요도 높아집니다.

하지만 반면에 AI 시대와 인터넷 시대를 비유하자면. 인터넷은 컴퓨터들의 네트워크이고, AI 모델은 네트워크에 연결된 컴퓨터라고 결론 내릴 수 있다. 누구나 PC와 스마트폰을 갖고 있는 것처럼, AI 시대에는 다양한 AI 모델이 등장하고, 모두가 하나의 완전한 생태계를 형성하게 될 것이다.

따라서 AI시대에는 더 많은 컴퓨팅 파워가 요구된다. 그러나 이제 컴퓨팅 성능의 비용은 너무 높고 부족하여 AI 개발 진행에 더욱 영향을 미칩니다. 이는 NVIDIA의 떨림과 글로벌 AI 개발 속도가 느려지는 것에서 알 수 있습니다.

게다가 우리는 장기적으로 보지 않더라도 단기적으로만 본다. 훈련부터 추론까지 컴퓨팅 성능에 대한 수요는 충족되지 않고 엄청납니다.

Neocortex x CBN의 계산을 인용합니다. Omdia 통계에 따르면 2023년 말 기준 Nvidia H100의 총 출하량은 120만 대에 달했습니다. 엔비디아는 2024년 4월 말까지 4분기 동안 AI 칩 판매를 통해 658억 달러를 벌어들였습니다. 각 H100의 가격이 미화 40,000달러인 것을 기준으로 NVIDIA는 지난 4분기 동안 약 164만 5천 개의 H100을 판매했습니다. 전체 모델 훈련 시장과 거의 동일합니다(즉, GPT-3.5 수준 100개, GPT-4 수준 50개, GPT-5 수준 대형 언어 모델 10개, Midjourney 수준 이미지 생성 모델 10개가 전 세계적으로 훈련되었다고 가정하고 1/ 소라급 영상 생성 모델 20개 중 4개).

이는 모델 훈련에 대한 시장 수요일 뿐입니다. 추론은 규모가 훨씬 더 크고 아직 실제로 열리지 않은 시장입니다. 각 사람이 한 달에 하나의 비디오만 생성한다고 보수적으로 계산하면 대규모 모델 추론을 위한 전 세계 컴퓨팅 전력 수요는 1,040만 개의 H100 칩에 해당하며 이는 모델 교육의 두 배입니다. 그리고 비디오 생성 기술과 시장이 더욱 성숙해지면 추론에 필요한 컴퓨팅 전력 소비가 교육 요구 사항의 수십 배, 심지어 수백 배까지 치솟을 것입니다.

구글 CEO 피차이는 "과소투자의 위험은 과잉투자의 위험보다 훨씬 크다"고 말했다.

Meta CEO Zuckerberg는 "개발 속도를 늦추어 비용을 절약하기보다는 과잉 투자를 선호합니다."라고 말했습니다.

마이크로소프트는 현재 AI 컴퓨팅 능력이 재정적 수입을 제한하고 있으며 이러한 상황은 적어도 2025 회계연도 1분기까지 지속될 것이라고 주장한다. 머스크는 엔비디아에 도전하기 위해 자신의 슈퍼컴퓨터도 개발했습니다.

마지막으로 Nvidia의 해자는 강합니까? 예.

NVIDIA의 미래에 관해 Coatue는 자신의 견해를 직접적으로 표현했습니다.버블이 있다면 그것은 가치평가 버블이 아니라 이익이 앞으로 당겨지는 버블이다.

그렇다면 엔비디아에 도전할 수 있는 사람은 누구일까요?

한편으로 위에서 언급한 세 가지 주요 비난에 비해 Nvidia는 소프트웨어 및 하드웨어 번들링이라는 더 큰 비난을 받고 있습니다.

오늘날 데이터 센터의 프로세서 중 95% 이상이 NVIDIA GPU를 사용합니다. 전체 클라우드 AI 수요는 여전히 CUDA 생태계에 의존하고 있으며 CUDA는 NVIDIA 칩에서만 사용할 수 있습니다. 프로그래머는 다른 언어를 배우고 싶어하지 않으며 CUDA는 NVIDIA의 해자로 간주되기도 합니다.

Nvidia의 "폭정"을 타도하기 위해 Google, Meta, Microsoft는 현재 OpenAI가 시작한 오픈 소스 언어 프로젝트 Triton에 참여하기를 원하고 있으며 Intel, AMD 및 Qualcomm도 Triton을 사용하여 Nvidia의 고객을 강탈하려고 합니다.

Triton이 Nvidia의 시장 점유율을 약화시킬 수는 있지만 Citi 분석가들은 Nvidia의 생성 AI 칩 시장 점유율이 2030년까지 여전히 약 63%에 달할 것으로 추정합니다. 이는 향후 수년간 지배력을 유지할 것임을 의미합니다.

한편, 거인들은 잇달아 도전장을 내놓았고, 엔비디아도 쉴 새 없이 달려오고 있다. 결국 황런순은 전임 시스코의 '오만으로 인한 문제'를 분명히 명심할 것이다.

칩 유형이 정기적으로 범용과 맞춤형을 번갈아가는 반도체 '마키모토 사이클'에 따르면, 특정 기간에는 범용 구조가 가장 인기가 있지만 특정 단계에 도달하면 특정 요구를 충족하는 특수 구조가 직접적으로 등장하게 됩니다. .

현재 엔비디아로 대표되는 보편적 구조의 시대는 전복의 과정에 있습니다.

더욱이 엔비디아는 올해 초 클라우드 컴퓨팅, 5G 통신, 게임, 자동차 및 기타 분야의 고객을 위한 맞춤형 칩을 구축하기 위해 새로운 사업부를 설립했습니다. 올해 출시되는 신형 닌텐도 스위치에 엔비디아의 커스텀 칩이 탑재될 가능성이 높다는 소식이 있다.

하지만 Nvidia는 정말 견고한가요? "과정은 옳으나 결과는 틀렸다."라는 문장이 생각났습니다. 부적절한 비유를 하자면, 엔비디아의 강력한 협상력이 AI 컴퓨팅 파워의 비용을 오랫동안 높게 유지하게 하여 대규모 확장을 방해한다면 말이죠. 혁신, 백래시도 있을 수 있습니다.