Nachricht

NVIDIA befindet sich in einer schwierigen Zeit. Warum sind wir immer noch optimistisch?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Text |. Shidao, Autor |. Shidao AI Group, Herausgeber |

NVIDIA war in letzter Zeit in Schwierigkeiten, und das ist eine große Sache.

Das erste ist „ausländische Aggression“. Aufgrund ständiger „kleinerer Schritte“ steht das Unternehmen vor einer kartellrechtlichen Untersuchung durch das US-Justizministerium.

Der zweite Grund sind „interne Sorgen“. Aufgrund von Produktdesignfehlern wird sich die Lieferzeit des neuen Blackwell-Chips um drei Monate verzögern.

Letzte Woche erlebte der Aktienkurs von Nvidia eine Achterbahnfahrt – am Dienstag fiel er um 7 %, am Donnerstag stieg er um fast 13 %, am Freitag fiel er um fast 7 %;Selbst wenn man die Volatilität betrachtet, hat Nvidia Bitcoin überholt.Die implizite Volatilität der 30-Tage-Option stieg kürzlich von 48 % auf 71 %, während der Bitcoin-DVOL-Index von 68 % auf 49 % fiel.

Der bekannte Hedgefonds Elliott sagte den Anlegern: Nvidia befinde sich in einer „Blase“ und die KI-Technologie werde überbewertet. Die Agentur sagte, dass die größten Kunden von Nvidia ihre eigenen Chips entwickeln und bezweifelte, dass die Giganten weiterhin Nvidias GPUs in großen Mengen kaufen würden. Wann wird die Blase platzen? Elliott glaubt, dass es zu einem Bruch kommen könnte, wenn die Finanzergebnisse von Nvidia schlecht sind.

Es lässt sich nicht leugnen, dass Nvidia in eine „unruhige Zeit“ eintritt, aber es ist noch zu früh, um „von allen Seiten umkämpft“ zu werden.

Die Überwachung zielt speziell auf die „sieben Zoll“ von NVIDIA ab und ist stabil, aber nicht rücksichtslos

Anfang Juli feuerte Frankreich den ersten Kartellbefehl gegen NVIDIA ab. In den folgenden Wochen geriet Nvidia auch ins Visier des US-Justizministeriums.

Die Informationen berichteten, dass Ermittler des US-Justizministeriums die Häuser von Nvidias „Gegnern“ und „Kunden“ besuchten, um die Anschuldigungen aller zu sammeln.

Vorwurf 1: NVIDIA bedroht Kunden.Wenn Sie AMD-Chips kaufen, erhöht Nvidia möglicherweise den Preis für Sie oder reduziert sogar die ursprünglich versprochenen GPU-Lieferungen.

Vorwurf 2: Nvidia erzwingt die Verteilung von Netzwerkkabeln und Racks.Zu den großen Leidtragenden zählen: Microsoft, Google, Amazon...

Um vorrangige Lieferrechte zu erhalten, biss Microsoft einmal die Zähne zusammen und kaufte die Netzwerkkabel von Nvidia. Bei der Abrechnung Anfang 2023 stellte sich heraus, dass 1/3 des an Nvidia gezahlten Geldes für diese „Edge“-Produkte ausgegeben wurde . Berichten zufolge hat sich der Netzwerkkabelumsatz von Nvidia auf 3,2 Milliarden US-Dollar mehr als verdreifacht, was 14 % des gesamten Rechenzentrumsumsatzes ausmacht.

Heute sagte auch Nvidia-Vizepräsident Andrew Bell: „Wer das Regal kauft, hat Vorrang beim Erhalt von GB200.“
Microsoft ist nach wochenlangem „Streit“ der Katastrophe entgangen, während Amazon und Google aufgrund ihres Zwanges zugestimmt haben.

Behauptung drei: Nvidia erwirbt Run:ai.Die Transaktion wurde Ende April dieses Jahres offiziell bekannt gegeben, der Kaufpreis beträgt 700 Millionen US-Dollar.

Run:ai ist ein israelisches Startup, das sich auf die Vereinfachung von KI-Anwendungen und Arbeitslasten auf GPUs konzentriert und dadurch KI-Chips effizienter macht, was wiederum dazu beiträgt, die Anzahl der Nvidia-GPUs zu reduzieren, die zur Erledigung von Aufgaben benötigt werden.

Nvidias Integration der Run:ai-Funktionalität in bestehende Produkte „vernichtet“ nicht nur die Möglichkeit der Nutzung durch Gegner, sondernDarüber hinaus hat das Unternehmen seine DGX- und DGX-Cloud-Reichweite erhöht.

Lao Huang Zaoyun sei „ein ‚guter Rückzugsort‘ für NVIDIA, um nicht zu Cisco zu werden.“ Einer davon ist, dass Cloud- und Softwareunternehmen jährlich Milliarden von Dollar erwirtschaften. Zweitens verfügt Nvidia über „alle Hebel“, um Dienste zu entwickeln, die seine Chips ergänzen.

Ob es nun die oben erwähnte „strikte Zuteilung von GPUs“, „die Beteiligung an der Verteilung von Waren und erzwungenem Kauf und Verkauf“ oder der „Aufbau einer Cloud und eines Ökosystems“ sind, das alles sind Huang Renxuns „harte Schritte“, um das NVIDIA-Imperium zu konsolidieren auf lange Sicht. Schließlich ist es sein Ziel, dass jedes Unternehmen auf der Welt ... auf Nvidia AI Enterprise läuft.

Daher kann diese Untersuchung des US-Justizministeriums als „stabil und genau“ bezeichnet werden und Nvidias „sieben Zoll“ erreichen.

Aber ob man rücksichtslos ist oder nicht, ist eine andere Sache. Denn oft dauern kartellrechtliche Ermittlungen jahrelang, und es kann sein, dass die Regierung letztendlich keine Anklage gegen das Zielunternehmen erhebt. Selbst wenn ein Gerichtsverfahren eingeleitet wird, kann sich der Fall über Jahre hinziehen, bevor er abgeschlossen wird.

Beispielsweise wurde der Kartellrechtsfall der Google-Suche im Jahr 2020 erst in diesem Jahr verhandelt, und der für den Fall zuständige Richter hat noch kein Urteil gefällt.

Zusammenfassend lässt sich sagen, dass diese Kartelluntersuchung, obwohl sie heftig und schnell durchgeführt wird, den Grundlagen des GPU-Imperiums offenbar nicht schaden kann.

Für Nvidia werden zwei direkte Auswirkungen erwartet.

Erstens betrifft es zukünftige Akquisitionen. Beispielsweise reichte die FTC im Jahr 2021 eine Klage aus kartellrechtlichen Gründen ein, um Nvidia daran zu hindern, 40 Milliarden US-Dollar für die Übernahme von Arm von SoftBank auszugeben. Aus heutiger Sicht kann Masayoshi Son dank der FTC wieder zum Leben erweckt werden.

Die zweite besteht darin, gegen die „Overlord-Vereinbarung“ vorzugehen. Schließlich wurde es ins Visier genommen, und Nvidias „kleine Schritte“ könnten zurückgehalten werden.

Nvidia zittert und die weltweite KI-Entwicklung verlangsamt sich

Lassen Sie uns über die „internen Bedenken“ der Nvidia-Produkte sprechen.

Berichten zufolgeAufgrund von Konstruktionsfehlern wurden die zuvor bestellten Modelle B100 und B200 storniert und später auf B200A aufgerüstet. Die Auslieferung beginnt voraussichtlich Mitte nächsten Jahres.

Der Fortschritt von GB200 hat sich derzeit jedoch nicht verzögert. Der „stärkste König“ GB200 ist nicht nur ein Chip, sondern eine leistungsstarke Plattform, die zwei B200-Chips vereint. (1 GB200 hat 1 Grace-CPU + 2 B200).

Es wird berichtet, dass die Marktnachfrage nach B100 selbst nicht groß ist und die Kunden von B100 auf B200 umgestiegen sind (Nachfrage nach mehr als 450.000 Einheiten).

Den Rückmeldungen einiger Institutionen zufolge besteht die derzeitige Lösung darin, zunächst H200 zu nutzen, um die Lücke zu schließen.Nvidia wird H200 hauptsächlich im dritten Quartal auf den Markt bringen und im Oktober und November einige H200 zu den Kunden hinzufügen, und spätestens im Dezember wird alles normal sein.

Diese Verzögerung wird die Bereitstellungspläne von Großkunden wie Meta, Google und Microsoft stören und kann sich auf den Entwicklungsfortschritt von Produkten und Diensten auswirken, die auf Nvidias KI-Chips basieren, einschließlich generativer KI, Videoverarbeitung und anderen KI-Anwendungen.

Mit anderen Worten: Selbst wenn Analysten „NVIDIA-Blase“ rufen, wird sich der globale KI-Entwicklungsprozess verlangsamen, sobald NVIDIA etwas passiert.

Das heißt, wenn Sie beweisen möchten, dass die NVIDIA-Blase kurz vor dem Platzen steht, oder wenn Sie beweisen möchten, dass die Marktnachfrage nach GPUs abnimmt, oder wenn Sie beweisen möchten, dass NVIDIA im Wettbewerb steht; Produkte beginnen zu glänzen.

Einen Treffernachweis kann man im Moment aber nicht erbringen.

Warum Sie optimistisch gegenüber Nvidia sind

Erstens: Steht die KI-Blase kurz vor dem Platzen? NEIN.

Als „pessimistischster“ Chef glaubt „Professor Dalong“ Daron Acemoglu, der Gott der internationalen Spitzenpublikationen, dass KI in den nächsten 10 Jahren die Produktivität um etwa 0,53 % bis 0,66 % und das BIP um etwa 0,9 % steigern wird.

Auch Jim Covello, weltweiter Leiter der Aktienanalyse bei Goldman Sachs, ist ziemlich pessimistisch: KI muss in der Lage sein, komplexe Probleme zu lösen, bevor ihre Einnahmen ihre Ausgaben übersteigen, die etwa eine Billion US-Dollar betragen.Was die KI-Blase betrifft, ist Covello der Ansicht, dass es lange dauern kann, bis sie platzt.

Gleichzeitig sind Morgan Stanley und Wall Streets „TMT King“ Coatue sehr optimistisch, was die Aussichten von KI angeht.

Morgan Stanley ist davon überzeugt, dass sich der aktuelle Investitionsboom in die KI-Infrastruktur in einem frühen Stadium befindet und noch nicht das Niveau der Internetblase von 1999 erreicht hat. Insbesondere die GPU-Investitionen haben gerade erst begonnen.

Coatue glaubt, dass KI kein Hype ist und das goldene Zeitalter noch nicht angekommen ist; KI ist keine Bewertungsblase, sondern hauptsächlich ein Spiel für Giganten.

Zweitens: Ist die GPU bereits voll? NEIN.

Hier ist der Kampf zwischen Sequoia und a16z.

Sequoia hat GPUs „schlecht geredet“ und geglaubt, dass der Höhepunkt des Versorgungsengpasses vorüber sei, und errechnete, dass die Umsatzlücke der KI-Branche aufgrund des Kaufs von GPUs 500 Milliarden US-Dollar erreicht habe.

a16z hingegen gab nicht nur Hunderte Millionen Dollar aus, um sich mit Tausenden von GPUs einzudecken, sondern startete auch öffentlichkeitswirksam das „Oxygen Project“ und plante schließlich, die Größe des GPU-Clusters auf mehr zu erweitern als 20.000 Einheiten.

Wie ist es praktisch? Wie wäre es, wenn wir unser Denken ändern.

Die herkömmliche Denkweise – das Modell ist leistungsstark und es tauchen Killeranwendungen auf – je größer der Bedarf an Rechenleistung, desto höher der Bedarf an GPU.

Aber andererseits, wenn wir eine Analogie zwischen der KI-Ära und der Internet-Ära ziehen. Daraus lässt sich schließen, dass das Internet ein Netzwerk von Computern ist und das KI-Modell ein mit dem Netzwerk verbundener Computer ist. So wie jeder über einen PC und ein Smartphone verfügt, werden im KI-Zeitalter verschiedene KI-Modelle auftauchen, die alle ein vollständiges Ökosystem bilden.

Daher erfordert das KI-Zeitalter mehr Rechenleistung. Aber jetzt sind die Kosten für Rechenleistung zu hoch und knapp, was den Fortschritt der KI-Entwicklung weiter beeinträchtigt. Dies lässt sich am Zittern von NVIDIA und der Verlangsamung der globalen KI-Entwicklung erkennen.

Darüber hinaus blicken wir nur kurzfristig, auch wenn wir nicht langfristig blicken. Vom Training bis zur Inferenz besteht ein enormer und ungedeckter Bedarf an Rechenleistung.

Zitieren der Berechnungen von Neocortex x CBN. Laut Omdia-Statistiken erreichten die Gesamtauslieferungen des Nvidia H100 Ende 2023 1,2 Millionen. In den vier Quartalen bis Ende April 2024 verdiente Nvidia 65,8 Milliarden US-Dollar durch den Verkauf von KI-Chips. Basierend auf einem Preis von 40.000 US-Dollar pro H100 hat NVIDIA in den letzten vier Quartalen etwa 1,645 Millionen H100 verkauft. Ungefähr äquivalent zum gesamten Markt für Modelltraining (d. h. unter der Annahme, dass weltweit 100 Modelle für große Sprachen auf GPT-3.5-Ebene, 50 Modelle auf GPT-4-Ebene, 10 Modelle für große Sprachen auf GPT-5-Ebene und 10 Modelle zur Bildgenerierung auf Midjourney-Ebene trainiert wurden, und 1/ 4 von 20 Videogenerierungsmodellen auf Sora-Ebene).

Dies ist nur die Marktnachfrage nach Modellinferenz, die um Größenordnungen größer ist und noch nicht wirklich geöffnet ist. Wenn wir konservativ berechnen, dass jede Person nur ein Video pro Monat generiert, entspricht der globale Rechenleistungsbedarf für die Inferenz großer Modelle 10,4 Millionen H100-Chips, was doppelt so viel ist wie für das Modelltraining. Und wenn die Videoerzeugungstechnologie und der Markt ausgereifter werden, wird der für die Inferenz erforderliche Rechenleistungsverbrauch auf das Dutzende oder sogar Hundertfache des Schulungsbedarfs ansteigen.

Google-Chef Pichai sagte: „Das Risiko einer Unterinvestition ist weitaus größer als das Risiko einer Überinvestition.“

Wie Meta-CEO Zuckerberg sagte: „Ich würde lieber zu viel investieren, als Geld zu sparen, indem ich die Entwicklung verlangsame.“

Microsoft behauptet, dass die derzeitige Kapazität der KI-Rechenleistung seine finanziellen Einnahmen begrenzt, und diese Situation wird mindestens bis zum ersten Quartal des Geschäftsjahres 2025 anhalten. Musk entwickelte sogar seinen eigenen Supercomputer, um Nvidia herauszufordern.

Ist Nvidias Burggraben schließlich stark? Ja.

Bezüglich der Zukunft von NVIDIA brachte Coatue seine Ansichten direkt zum Ausdruck:Wenn es eine Blase gibt, handelt es sich nicht um eine Bewertungsblase, sondern um eine Blase, in der Gewinne vorgezogen werden.

Wer kann also Nvidia herausfordern?

Einerseits hat Nvidia im Vergleich zu den drei oben genannten Hauptvorwürfen einen größeren Vorwurf: Software- und Hardware-Bündelung.

Heutzutage nutzen mehr als 95 % der Prozessoren in Rechenzentren NVIDIA-GPUs. Der gesamte Bedarf an Cloud-KI hängt immer noch vom CUDA-Ökosystem ab, und CUDA kann nur mit NVIDIA-Chips verwendet werden. Programmierer wollen keine andere Sprache lernen und CUDA gilt sogar als NVIDIAs Burggraben.

Um Nvidias „Tyrannei“ zu stürzen, wollen Google, Meta und Microsoft derzeit gemeinsam an dem von OpenAI gestarteten Open-Source-Sprachprojekt Triton teilnehmen; auch Intel, AMD und Qualcomm wollen Triton nutzen, um Nvidias Kunden abzuwerben.

Obwohl Triton Nvidias Marktanteil schwächen könnte, schätzen Citi-Analysten, dass Nvidias Anteil am Markt für generative KI-Chips bis 2030 immer noch etwa 63 % betragen wird, was bedeutet, dass das Unternehmen seine Dominanz noch viele Jahre lang beibehalten wird.

Auf der anderen Seite haben die Giganten nacheinander Herausforderungen herausgegeben, und auch Nvidia ist ständig am Rennen. Schließlich wird sich Huang Renxun sicherlich an die „durch Arroganz verursachten Probleme“ seines Vorgängers Cisco erinnern.

Gemäß dem Halbleiter-„Makimoto-Zyklus“ – bei dem die Chiptypen regelmäßig zwischen Allzweck- und kundenspezifischen Chips wechseln – sind Allzweckstrukturen während eines bestimmten Zeitraums am beliebtesten, aber ab einem bestimmten Stadium werden spezialisierte Strukturen, die bestimmte Anforderungen erfüllen, direkt auf dem Vormarsch sein .

Gegenwärtig befindet sich die Ära der universellen Strukturen, die NVIDIA repräsentiert, im Untergang.

Darüber hinaus hat Nvidia Anfang dieses Jahres eine neue Geschäftseinheit gegründet, um maßgeschneiderte Chips für Kunden in den Bereichen Cloud Computing, 5G-Telekommunikation, Spiele, Automobile und anderen Bereichen zu bauen. Es gibt Neuigkeiten, dass die neue Nintendo Switch, die dieses Jahr auf den Markt kommt, wahrscheinlich mit den maßgeschneiderten Chips von Nvidia ausgestattet sein wird.

Aber ist Nvidia absolut grundsolide? Ich dachte an einen Satz: „Der Prozess ist richtig, aber das Ergebnis ist falsch.“ Um eine unangemessene Analogie zu verwenden, wenn Nvidias starke Verhandlungsmacht dazu führt, dass die Kosten für KI-Rechenleistung über einen langen Zeitraum hoch bleiben und so eine großflächige Nutzung verhindert Innovation kann es auch zu Gegenreaktionen kommen.