Nachricht

selten!Bericht: Veröffentlichung des neuesten KI-Chips von Nvidia aufgrund von Designfehlern verzögert

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Die Veröffentlichung des fortschrittlichsten KI-Chips in Nvidias neuer Blackwell-Chipserie könnte sich verzögern.

Laut The Information unter Berufung auf mit der Angelegenheit vertraute Personen wird Nvidias kommender Chip für künstliche Intelligenz dies tunVerzögerungen von drei Monaten oder mehr aufgrund von Konstruktionsfehlern.

Dies könnte Kunden wie Meta Platforms, Google und Microsoft betreffen, die gemeinsam Chips im Wert von mehreren zehn Milliarden Dollar bestellt haben.

Nvidia wollte sich zu der Ankündigung der Verzögerung nicht äußern, sagte jedoch, dass Kunden Muster der Blackwell-Chips testen und „die Produktion voraussichtlich noch in diesem Jahr hochgefahren wird“.

Es ist nicht üblich, dass größere Designfehler vor der Massenproduktion entdeckt werden

Die Informationen zitierten Personen, die an der Blackwell-Chipproduktion beteiligt waren, mit der Aussage, dass in den letzten Wochen Designprobleme bei Blackwell aufgetreten seien.Denn die TSMC-Ingenieure entdeckten den Fehler bei der Vorbereitung der Massenproduktion.

Der GB200-Chip enthält zwei verbundene Blackwell-GPUs und eine Grace-Zentraleinheit. Der Defekt betrifft einen Prozessorchip (ein Stück Silizium, das die Schaltkreise des Chips beherbergt), der mit zwei Blackwell-GPUs verbunden ist. Die Hürde verringert die Menge an Chips, die TSMC für Nvidia produzieren kann, und kann sogar dazu führen, dass das Unternehmen die Produktion einstellt.

Berichten zufolge führt Nvidia mit seinem Chiphersteller TSMC einen neuen Testproduktionslauf durch.Um die Maschine nicht einschränken zu lassen,Um das Problem zu lösen, hat TSMC die Produktion eines weiteren hochkarätigen Produkts wieder aufgenommen, das sich der Massenproduktion nähert.Auch diese Situation kommt selten vor.

Analysten halten es für höchst ungewöhnlich, dass größere Konstruktionsfehler vor der Massenproduktion entdeckt werden. Denn um die Machbarkeit des Produkts und einen reibungslosen Herstellungsprozess sicherzustellen, sind im Frühstadium mehrere Produktionstestläufe und Simulationen erforderlich.

Nach dem ursprünglichen Plan wird TSMC im dritten Quartal mit der Massenproduktion von Blackwell-Chips beginnen und im vierten Quartal mit der Auslieferung an Nvidia beginnen. Huang sagte im Mai, dass das Unternehmen plante, noch in diesem Jahr große Mengen Blackwell auszuliefern.

Dieses Designfehlerproblem könnte die Entwicklung der Hauptchips von Blackwell (B200 und GB200) um drei Monate oder mehr verzögern, und die Massenproduktion von Blackwell wird sich bis zum ersten Quartal nächsten Jahres verzögern. Nach Erhalt der Chips dauert es typischerweise etwa drei Monate, bis Cloud-Anbieter ihre Großcluster in Betrieb nehmen.

Die Erwartungen der Giganten wurden enttäuscht und es ist noch unklar, wann die Ware eintrifft.

Blackwell kann in den Köpfen von Technologieunternehmen als das „weiße Mondlicht“ beschrieben werden, das die großen Hoffnungen von Giganten in sich trägt.

Wenn sich die kommenden KI-Chips wie B100, B200 und GB200 um drei Monate oder mehr verzögern, könnten Nvidias Kunden enttäuscht sein.

Zu diesen Kunden gehören Microsoft, Meta und OpenAI usw. Sie haben große Erwartungen an die KI-Chips von Nvidia und planen, die von Nvidia entwickelten „Supercomputer“ zu nutzen, um zukünftige Generationen groß angelegter Sprachmodelle, Meta-KI-Assistenten und andere automatisierte Funktionen zu produzieren.

Die Information zitierte mit der Angelegenheit vertraute Personen mit den Worten, Meta habe Bestellungen im Wert von mindestens 10 Milliarden US-Dollar aufgegeben, während Microsoft seinen Auftragsumfang in den letzten Wochen um 20 % erhöht habe. Microsoft plant, bis zum ersten Quartal 2025 55.000 bis 65.000 GB200-Chips für OpenAI bereitzuhalten.

Offensichtlich ist das Datum, an dem Microsoft diese Bestellungen erhielt, unbekannt.

Möglicherweise sind NVLink-Server-Racks betroffen

Der Designfehler wird sich auch auf die Produktion und Lieferung von Nvidia NVLink-Server-Racks auswirken, da Unternehmen, die an Servern arbeiten, auf neue Chipmuster warten müssen, bevor sie die Server-Rack-Designs finalisieren.

Zuvor wies der Analyst von Tianfeng International, Ming-Chi Kuo, darauf hin, dass es keinen Zweifel an der Rechenleistung des GB200 NVL36 gebe, er aber auch mit vielen beispiellosen Design- und Produktionsherausforderungen konfrontiert sei .

Jeder GB200 NVL36-Schrank verbraucht etwa 80 kW Strom. Laut einer Umfrage von AMAX im April dieses Jahres können derzeit weniger als 5 % der Rechenzentren weltweit 50 kW-Server pro Schrank unterstützen. Daher müssen Sie vor dem Kauf des GB200 NVL36 sicherstellen, dass genügend Platz für die Installation vorhanden ist.
Die Einzelschrankversion des GB200 NVL72 verbraucht 130 kW pro Schrank und kann kurzfristig nicht in Massenproduktion hergestellt werden.