Nachricht

Die Veröffentlichung des neuen KI-Chips von Nvidia wird sich um mindestens drei Monate verzögern und Giganten wie Microsoft, Google und Meta werden davon betroffen sein.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Höhepunkte:

Tencent Technology News, 3. August: Laut ausländischen Medienberichten ist bei Nvidias neuestem Chip-Projekt für künstliche Intelligenz ein Designfehler aufgetreten. Nach Angaben zweier an der Chip- und Server-Hardware-Produktion beteiligter Quellen wird dieser Unfall zu einer Verzögerung der Veröffentlichung um mindestens drei Jahre führen Monate, oder sogar länger.

Es wird erwartet, dass die Änderung Auswirkungen auf eine Reihe großer Kunden haben wird, darunter Meta, Google und Microsoft, die Chips der Serie im Wert von mehreren zehn Milliarden Dollar vorbestellt haben.

NVIDIA hat Microsoft, einen seiner größten Kunden und einen weiteren großen Cloud-Dienstleister, diese Woche darüber informiert, dass sich die Lieferung seiner modernsten Chips für künstliche Intelligenz der Blackwell-Serie verzögern wird, so interne Microsoft-Mitarbeiter und eine andere mit der Angelegenheit vertraute Person .

NVIDIA hat die Blackwell-Serie im März dieses Jahres offiziell auf den Markt gebracht. CEO Huang Jenxun gab im Mai optimistisch bekannt, dass er plant, innerhalb des Jahres große Auslieferungen dieser Chipserie zu erreichen. Der Prozess erlitt jedoch einen Rückschlag, da es bei der Gestaltung zu Schwierigkeiten kam. Nach Angaben von Personen, die direkt an der Blackwell-Chipproduktion beteiligt sind, arbeitet Nvidia mit seinem Chiphersteller TSMC zusammen, um eine neue Runde intensiver Testproduktionen durchzuführen, um aktuelle technische Hindernisse zu überwinden.

Vor diesem Hintergrund wird erwartet, dass die Lieferungen von Blackwell-Chips in großem Umfang auf das erste Quartal des nächsten Jahres verschoben werden. Es ist erwähnenswert, dass die Bereitstellung und Aktivierung großer Chip-Cluster etwa weitere drei Monate dauern wird, sobald die Cloud-Dienstanbieter die Chips erhalten.

Design- und Produktionsprobleme haben die Besorgnis über die Situation von Nvidia verstärkt, insbesondere da das US-Justizministerium Beschwerden über angeblich wettbewerbswidriges Verhalten untersucht. Dennoch behauptet Nvidia aufgrund der erheblichen Leistungsvorteile seiner Chips weiterhin seine führende Position in der Branche.

Die Aktionäre setzen große Hoffnungen in die Blackwell-Serie, und Analysten von Keybanc Capital Markets gehen davon aus, dass die Chip-Serie den Umsatz von Nvidias Rechenzentren von 47,5 Milliarden US-Dollar im Jahr 2024 auf über 200 Milliarden US-Dollar im Jahr 2025 steigern wird. Huang Jen-Hsun sagte während der Telefonkonferenz im Mai: „Wir werden erleben, wie Blackwell dieses Jahr erhebliche Einnahmen erzielen wird!“

Nvidias Serverchip für künstliche Intelligenz, die Grafikverarbeitungseinheit (GPU), ist seit langem die zentrale treibende Kraft für Entwickler wie OpenAI im Bereich der künstlichen Konversations- und Videointelligenz. Gleichzeitig helfen diese GPUs Cloud-Service-Giganten wie Microsoft, durch die Vermietung von Chip-Ressourcen an andere Entwickler ein deutliches Umsatzwachstum zu erzielen.

Wenn es bei den kommenden Chips für künstliche Intelligenz B100, B200 und GB200 zu Verzögerungen von mindestens drei Monaten kommt, könnte dies die Bereitstellungspläne einiger Kunden stören und dazu führen, dass sie nicht wie geplant im ersten Quartal 2025 große Chip-Cluster in Rechenzentren betreiben können .

Schwergewichtige Kunden wie Microsoft, OpenAI und Meta warten gespannt auf die neuen Chips von Nvidia und wollen diese Technologien nutzen, um die nächste Generation großer Sprachmodelle zu aktualisieren und zu entwickeln, die die Kernsoftware hinter ChatGPT, Meta AI Assistant und einer Reihe innovativer Automatisierungen bilden Funktionen.

Diese Unternehmen betonen den Bedarf an mehr Rechenleistung, um Quantensprünge in der Softwareleistung zu erzielen und präziser auf komplexe Abfragen zu reagieren, mehrstufige Aufgaben zu automatisieren oder äußerst realistische Videoinhalte zu generieren. Sie setzen große Hoffnungen in Nvidias Chips für künstliche Intelligenz der nächsten Generation, insbesondere in die Leistungssprünge, die sie bei der Integration in Supercomputer-Cluster bringen können.

Ein Nvidia-Sprecher äußerte sich zurückhaltend gegenüber Aussagen zu verspäteten Lieferungen und sagte lediglich, dass „der Produktionsfortschritt wie geplant im Laufe dieses Jahres beschleunigt“ werde.

Offizielle Vertreter von Microsoft, Google, Amazon und Meta verzichteten auf einen Kommentar. Ein TSMC-Sprecher antwortete nicht auf eine Bitte um Stellungnahme.

Bemerkenswert ist, dass Nvidias Großkunden große Hoffnungen in den GB200-Chip setzen und ehrgeizige Pläne haben. Kürzlich haben Google, Meta und Microsoft ihr enormes Investitionswachstum in Rechenzentren und Chips für künstliche Intelligenz bekannt gegeben. Dieser seltene Schritt trieb nicht nur vorübergehend den Aktienkurs von Nvidia in die Höhe, sondern löste auch Bedenken am Markt hinsichtlich des Investitionsrenditezyklus und der Gewinnaussichten dieser Unternehmen aus. Ausführlich besprochen.

Blackwell-Großauftrag

Laut zwei Quellen aus dem Bereich der Chipproduktion hat Google mehr als 400.000 GB200-Chips zusammen mit der dazugehörigen Server-Hardware bestellt, der Gesamtbestellwert dürfte weit über 10 Milliarden US-Dollar liegen, die konkrete Lieferzeit ist jedoch noch unklar. Im Gegensatz dazu sind die Investitionen von Google in Chips, Ausrüstung und Vermögenswerte in diesem Jahr auf etwa 50 Milliarden US-Dollar gestiegen, was einer Steigerung von mehr als 50 % gegenüber dem Vorjahr entspricht.

Gleichzeitig unternimmt auch Meta große Schritte und die Gesamtaufträge werden voraussichtlich nicht weniger als 10 Milliarden US-Dollar betragen. Obwohl Microsoft den Gesamtauftragsumfang nicht bekannt gab, hat Microsoft in den letzten Wochen schrittweise Anpassungen der Bestellungen um 20 % vorgenommen. Laut Personen mit direktem Wissen bereitet Microsoft die Konfiguration von 55.000 bis 65.000 GB200-Chips für OpenAI bis zum ersten Quartal 2025 vor.

Eine mit der Angelegenheit vertraute Person sagte, dass Microsoft ursprünglich geplant hatte, Blackwell-basierte Server bis Januar nächsten Jahres an OpenAI auszuliefern, nun aber möglicherweise auf März oder Frühjahr umgestellt werden müsse.

Zwei Insider, die am Herstellungsprozess des Blackwell-Chips beteiligt waren, sagten, dass in den letzten Wochen Designschwierigkeiten mit dem Chip aufgetreten seien und TSMC-Ingenieure in der Vorbereitungsphase für die Massenproduktion wesentliche Mängel entdeckt hätten. Das Problem konzentriert sich insbesondere auf den Prozessorchip, der die beiden Blackwell-GPUs verbindet. Der Ausfall dieser Siliziumkomponente wirkt sich direkt auf die Gesamtleistung aus, was bedeutet, dass die Anzahl der Chips, die TSMC an Nvidia liefern kann, begrenzt ist. Solche Probleme veranlassen Unternehmen häufig, die Produktion einzustellen.

Vor diesem Hintergrund passt NVIDIA den Designplan dringend an und muss Produktionstests bei TSMC erneut durchführen, um sicherzustellen, dass das Problem behoben ist, bevor mit der Massenproduktion begonnen wird.

Nach Angaben von mit der Angelegenheit vertrauten Personen hat Nvidia gegenüber mindestens einem Cloud-Dienstleister offengelegt, dass das Unternehmen zur Bewältigung der aktuellen Schwierigkeiten und zur Beschleunigung der Produktauslieferung erwägt, alternativ eine Version auf den Markt zu bringen, die nur mit einem einzigen Blackwell-Chip ausgestattet ist .

ungewöhnliche Verzögerung

TSMC hatte ursprünglich geplant, die Massenproduktion von Blackwell-Chips im dritten Quartal zu starten, und erwartete, im vierten Quartal mit der Massenlieferung an Nvidia-Kunden zu beginnen. Allerdings wird nun damit gerechnet, dass sich die Massenproduktion von Blackwell-Chips bis zum vierten Quartal verzögern wird. Sollten in Zukunft keine neuen Probleme auftreten, werden Server in den folgenden Quartalen in großen Mengen ausgeliefert.

Verzögerungen bei der Chipproduktion sind keine Seltenheit. Nach Angaben von mit der Angelegenheit vertrauten Personen kam es bei Nvidias frühen Versionen seiner Flaggschiff-GPU im Jahr 2020 ebenfalls zu Verzögerungen, aber zu diesem Zeitpunkt war der Markteinfluss noch gering und die Erwartungen der Kunden an Bestellungen waren nicht hoch. Daher waren die unmittelbaren Auswirkungen auf Rechenzentren und Die Erträge aus Chip-Investitionen waren begrenzt.

Es ist jedoch ungewöhnlich, dass kurz vor der Massenproduktion ein schwerwiegender Konstruktionsfehler entdeckt wird. Unter normalen Umständen arbeitet das Chipdesign-Team eng mit Herstellern wie TSMC zusammen und durchläuft mehrere Runden von Produktionstests und Simulationen, um sicherzustellen, dass das Produkt ausgereift und zuverlässig ist, bevor es Großaufträge annimmt.

Laut internen TSMC-Mitarbeitern hat TSMC als weltweit führender Chiphersteller selten seine Produktionslinie unterbrochen, um dieses Produkt, das kurz vor der Massenproduktion steht, neu zu gestalten. Angesichts des Massenproduktionsplans für GB200-Chips hat TSMC Produktionsressourcen vorab zugewiesen, diese Ressourcen bleiben jedoch ungenutzt, bis das Problem gelöst ist.

Darüber hinaus wirkte sich der Konstruktionsfehler auch auf den Produktions- und Lieferplan der NVLink-Server-Racks von Nvidia aus, da die entsprechenden Unternehmen auf neue Chipmuster warten müssen, um das Rack-Design fertigzustellen. (Zusammengestellt/Goldener Hirsch)