Nachricht

Versuchen die 3 Billionen Chipkonzerne auch zu überleben?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia plant, wieder spezielle KI-Chips für den chinesischen Markt zu produzieren.

Laut dem neuesten Bericht von Reuters sagten mit der Angelegenheit vertraute Personen, dass Intel einen neuen Flaggschiff-KI-Chip für den chinesischen Markt entwickelt, der die Anforderungen der aktuellen US-Exportkontrollen erfüllt und ein weiteres Mitglied der inländischen Nvidia-Spezialchippalette hinzufügt.

Erwähnenswert ist, dass Nvidia im März dieses Jahres die „Blackwell“-Serie herausgebracht hat, die voraussichtlich noch in diesem Jahr in Serie produziert wird. Laut Nvidia ist der B200 bei bestimmten Aufgaben 30-mal schneller der derzeit besten verfügbaren KI-Chips.

Dieser neue spezielle Flaggschiff-Chip steht ebenfalls im Zusammenhang mit dem B200. Quellen zufolge wird Nvidia mit der Inspur Group, einem seiner Hauptvertriebspartner in China, zusammenarbeiten, um diesen Chip auf den Markt zu bringen, der laut Namensgebung vorläufig „B20“ genannt wird verfügt möglicherweise über einige Funktionen des B200.

Mit diesem B20 hat Nvidia in etwas mehr als einem Jahr sieben oder acht Spezialchips für den chinesischen Markt auf den Markt gebracht.

A800 und H800

Am 7. Oktober 2022 kündigte die US-Regierung eine Reihe von Exportkontrollmaßnahmen an, darunter die Einstellung der Lieferung bestimmter Halbleiterchips und Chipherstellungsanlagen nach China.

Es betrifft nicht nur Produktionsanlagen wie Fotolithografiemaschinen, sondern schränkt auch Chinas Zugang zu Hochleistungsrechnern und Chips für künstliche Intelligenz im Rahmen fortschrittlicher Prozesse ein, einschließlich des Verbots von US-Unternehmen wie Nvidia und AMD, solche Chips an China zu verkaufen, und auch die Einschränkung von Chinas künstlicher Intelligenz . Chip-Unternehmen führen Tape-Out in ausländischen Fab-Fabriken mit amerikanischer Technologie durch.

Von dieser Exportbeschränkung waren sowohl Nvidia als auch AMD betroffen.

Nach der Einführung der Beschränkungen sagte Nvidia, dass das Verbot seine A100- und H100-Chips betreffe, die maschinelle Lernaufgaben beschleunigen sollen, und den Abschluss der Entwicklung seines Flaggschiff-H100-Chips behindern könnte, der 2022 auf den Markt kommen soll. Es wurde darauf hingewiesen, dass der Umsatz der betroffenen Chips in China im Laufe des Quartals 400 Millionen US-Dollar erreicht habe. Sollten sich chinesische Unternehmen dazu entschließen, Nvidias Ersatzprodukte nicht zu kaufen, wäre dieses Geld umsonst verloren.

Wie schränken US-Exportbeschränkungen konkret Nvidia-Chips ein?

Gemäß den vom US-Handelsministerium am 7. Oktober 2022 herausgegebenen Exportbeschränkungsregeln für integrierte Schaltkreise für fortgeschrittene Computer (ECCN 3A090 und 4A090) muss die Liste der kontrollierten Artikel die folgenden Bedingungen erfüllen:

a. Integrierte Schaltkreise, außer flüchtigen Speichern, mit einer gesamten bidirektionalen Übertragungsrate aller Ein- und Ausgänge oder programmierbar auf 600 GB/s oder mehr, und einer der folgenden integrierten Schaltkreise:

a.1. Eine oder mehrere digitale Prozessoreinheiten, die Maschinenanweisungen ausführen, wobei die Bitlänge jeder Operation mit der Verarbeitungsleistung in TOPS multipliziert wird und die Summe aller Prozessoreinheiten 4800 oder mehr beträgt;

a.2. Eine oder mehrere digitale „Rohrecheneinheiten“ (ausgenommen Einheiten, die bei der Ausführung von Maschinenanweisungen im Zusammenhang mit der Berechnung der TOPS von Unternummer 3A090.a.1 helfen), deren Bitlänge pro Operation mit der Summe aller Recheneinheiten multipliziert wird Die TOPS-Verarbeitungsleistung beträgt 4800 oder mehr;

a.3. Eine oder mehrere Simulations-, Mehrwert- oder mehrstufige „Original-Recheneinheiten“, deren Verarbeitungsleistung als TOPS multipliziert mit 8 berechnet wird und deren Gesamtheit aller Recheneinheiten 4800 erreicht oder überschreitet;

a.4. Jede Kombination aus digitalen Prozessoreinheiten und „Original-Rechnereinheiten“, deren Summe gemäß Unternummer 3A090.a.1, 3A090.a.2 und 3A090.a.3 4800 oder mehr beträgt.

Der in Unternummer 3A090.a beschriebene integrierte Schaltkreis umfasst eine Grafikverarbeitungseinheit (GPU), eine Tensorverarbeitungseinheit (TPU), einen neuronalen Prozessor, einen Speicherprozessor, einen Bildprozessor, einen Textprozessor, einen Co-Prozessor/Beschleuniger, adaptive Verarbeitungsgeräte und feldprogrammierbare Logikgeräte (FPLD) und anwendungsspezifische integrierte Schaltkreise (ASIC).

Es ist nicht schwer zu erkennen, dass der wichtigste Punkt die Grenze der Chip-Verbindungsgeschwindigkeit ist. Gemäß dieser Regelung lag der beliebte A100 von NVIDIA genau innerhalb dieser Grenze, und seine Übertragungsrate zwischen den Chips erreichte ab einem bestimmten Wert In gewisser Weise hat das US-Handelsministerium diese Einschränkung möglicherweise auf der Grundlage von A100 festgelegt.

Um den Exportkontrollen zu begegnen, kastrierte NVIDIA schnell einen Ersatz für den A100-A800. Das US-Verbot wurde am 7. Oktober 2022 offiziell verkündet, und einen Monat später brachte NVIDIA den A800 auf den Markt, der sich an die neuen Vorschriften anpasst Früher musste es an die örtlichen Gegebenheiten angepasst werden, jetzt wird es an die politischen Bedingungen angepasst.

Den Spezifikationen zufolge wird der NVIDIA A800 die gleiche Chiparchitektur wie die Ampere A100 GPU verwenden. Es wird in drei Versionen erhältlich sein, zwei PCIe-Versionen mit 40 GB und 80 GB sowie einer 80 GB SXM-Version. Diese GPUs bieten bis zu 9,7 TFLOP von FP64, 19,5 TFLOP von FP64 Tensor Core, 19,5 TFLOP von FP32 und 156 TFLOP (312 TFLOPs Sparsity) TF32, 312 TFLOPs (624 TFLOPs Sparsity) BFLOAT16 und 624 TOPS (1248 TOPs Sparsity) INT8 Leistung. Die 40-GB-Version verfügt über HBM2-Speicher mit bis zu 1,555 TB/s Bandbreite, während die 80-GB-Version über HBM2e mit bis zu 2 TB/s Bandbreite verfügt.

Um der begrenzten Nachfrage gerecht zu werden, wurde die Bandbreite natürlich zwangsläufig von ursprünglich 600 GB/s auf 400 GB/s gekürzt. Ein Nvidia-Sprecher sagte in einer Erklärung gegenüber Reuters: „Die A800-GPU wurde in Betrieb genommen Im dritten Quartal ist der A800 eine Alternative zur A100-GPU für chinesische Kunden. Er erfüllt die expliziten Tests der US-Regierung zur Reduzierung der Exportkontrolle und kann nicht über diesen Standard hinaus programmiert werden.“

Wayne Lam, Analyst bei CCS Insight, kommentierte: „Der A800 scheint eine neu verpackte A100-GPU zu sein, die entwickelt wurde, um die jüngsten Handelsbeschränkungen des Handelsministeriums zu umgehen“, und wies darauf hin, dass 8 in China eine Glückszahl sei.

„China ist ein wichtiger Markt für Nvidia, und es ist wirtschaftlich sinnvoll, das Produkt neu zu konfigurieren, um Handelsbeschränkungen zu vermeiden“, sagte Lam, der sagte, dass die Inter-Chip-Kommunikationsfähigkeiten des A800 für Rechenzentren mit Tausenden von Chips erheblich reduziert wurden.

Beim darauffolgenden H100 zog Nvidia nach und präsentierte den H800. Beim A100 hat Nvidia die 600-GB/s-Verbindung der GPU auf 400 GB/s gesenkt, und beim H100 hat Nvidia das Gleiche getan. Berichten zufolge wurde die Chip-Verbindungsrate von H800 auf etwa die Hälfte der von H100 reduziert, also von 800 GB/s auf 400 GB/s. Im Vergleich zum A800 wirkt sich die Leistung des H800 stärker aus, schließlich ist ersteres nur um 33 % reduziert, letzteres sogar um ganze 50 %.

Ein Nvidia-Sprecher weigerte sich damals, den Unterschied zwischen dem H800 und dem H100 für den chinesischen Markt offenzulegen, und sagte lediglich, dass „unsere Produkte der 800er-Serie vollständig den Exportkontrollbestimmungen entsprechen“.

Während ausländische Hersteller hektisch A100 und H100 kaufen, können inländische Hersteller nur H800 und A800 mit niedrigeren Konfigurationen wählen. Die spezielle Version des Chips von NVIDIA hat die Entwicklung großer inländischer KI-Modelle bis zu einem gewissen Grad eingeschränkt.

H20 und RTX 4090D

Für inländische Unternehmen haben A800 und H800 gute und schlechte Eigenschaften. Das Schlechte ist, dass die Leistung dieser beiden Chips etwas schlechter ist und auch die Trainingsgeschwindigkeit viel langsamer ist Sie sind sowohl gut als auch schlecht. Sie können über Zhengcheng-Kanäle bestellt werden, aber im Vergleich zu ausländischen Unternehmen sind die Kosten für Chips höher.

Aber auch der A800 und der H800 hielten nicht länger als ein Jahr. Am 17. Oktober 2023 erließ das US-Handelsministerium am 7. Oktober 2022 neue Kontrollregeln zur Regulierung des Exports von integrierten Schaltkreisen für fortschrittliche Computer, Halbleiterfertigungsgeräten und Artikeln, die Supercomputing-Anwendungen und Endverwendungen unterstützen. Weitere Aktualisierungen.

Die wichtigsten davon sind Änderungen der Kontrollparameter. Die vorläufige endgültige Regelung entfernt die „Verbindungsbandbreite“ als Parameter zur Identifizierung eingeschränkter Chips gemäß ECCN 3A090 und ändert sie stattdessen dahingehend, dass der Chip die beiden in ECCN 3A090 kalibrierten Parameter überschreitet (3A090. a und 3A090.b) wird der Export eingeschränkt.

Den Dokumenten des US-Handelsministeriums zufolge regeln die überarbeiteten Regulierungsparameter 3A090.a integrierte Schaltkreise mit einer oder mehreren digitalen Verarbeitungseinheiten, und die „Gesamtverarbeitungsleistung“ dieser Einheiten muss 4800 oder mehr oder mehr betragen, bzw. „Gesamtverarbeitung“. „Leistung“ beträgt 1600 oder höher und „Leistungsdichte“ beträgt 5,92 oder höher. Die neue ECCN 3A090.b regelt integrierte Schaltkreise mit einer oder mehreren digitalen Verarbeitungseinheiten, die eine der folgenden Bedingungen erfüllen müssen: eine „Gesamtverarbeitungsleistung“ von 2400 oder mehr, aber weniger als 4800 und eine „Leistungsdichte“ von 1,6 oder 1,6 oder mehr, aber weniger als 5,92, oder die „Gesamtverarbeitungsleistung“ beträgt 1600 oder mehr und die „Leistungsdichte“ beträgt 3,2 oder mehr als 3,2, aber weniger als 5,92.

Darüber hinaus führt die Regel zu einer Lizenzausnahme, die einen neuen „Lizenzausnahmehinweis für Advanced Computing“ für Verbraucher-ICs mit Fähigkeiten zur künstlichen Intelligenz unterhalb des restriktiven Schwellenwerts erstellt. Die Ausnahme gilt für zwei Produkte, von denen eines für die Verwendung in Daten entwickelt oder verkauft wird Die zweiten sind Chips, die nicht für den Einsatz in Rechenzentren entwickelt oder verkauft werden, haben eine „Gesamtverarbeitungsleistung“ von 4800 oder höher.

Gegenüber den Regelungen vom 7. Oktober 2022 wurde der Kontrollumfang durch die Doppelregelung Gesamtverarbeitungsleistung und Leistungsdichte noch einmal erweitert Betroffen sind A800 und H800, aber auch andere Nvidia-Produkte sind vom Verbot betroffen. Auch der L40 und L40S für den Reasoning-Markt sowie der RTX 4090 für den Consumer-Bereich sind betroffen.

Dies war ein schwerer Schlag für Nvidia, was dazu führte, dass die damals von Nvidia verkauften Mainstream-Produkte aufgrund von Exportkontrollen nicht in China verkauft werden konnten. Sie müssen wissen, dass in den vergangenen Jahren die Einnahmen aus dem Rechenzentrumsgeschäft auf dem chinesischen Markt entfielen Etwa 20 bis 25 % des Gesamtumsatzes von Nvidia, und im vierten Quartal des Geschäftsjahres 2024 brachen die Einnahmen auf dem chinesischen Markt aufgrund von Exportkontrollen in den einstelligen Bereich ein.

Hilflos konnte Nvidia nur noch einmal die Machete schwingen.

Am 16. November 2023, einen Monat nach der Veröffentlichung der neuen Regeln, brachte NVIDIA GPU-Chips speziell für den chinesischen Markt auf den Markt – H20, L20 und L2 basieren auf der Hopper-Architektur von NVIDIA, während L20 und L2 auf der Ada basieren die Architektur.

Unter ihnen wurden die beiden Chips L20 und L2 auf der Grundlage von L40 bzw. L4 angepasst. Da es sich um alte Architekturen handelt, die in der Argumentation und im Training nicht häufig verwendet werden, wurde ihnen nicht viel Aufmerksamkeit geschenkt. Interessanter ist der H20, der zwar die Internetgeschwindigkeit nicht mehr einschränkt, dafür aber satte 900 GB/s erreicht, allerdings muss die Leistung nach Meinung des Analysten Dylan Petal stark abgewertet werden Auslastung des H20 Der Wirkungsgrad kann 90 % erreichen, aber seine Leistung in der tatsächlichen Multi-Card-Verbindungsumgebung beträgt immer noch nur nahezu 50 % des H100.

Für den RTX 4090 im Verbrauchermarkt hat NVIDIA im Dezember letzten Jahres auch einen Ersatz auf den Markt gebracht – den RTX 4090D. Dieser spezielle Chip, der den US-Exportkontrollen entspricht, wurde hinsichtlich des CUDA-Kerns und des Stromverbrauchs reduziert. 12,8 %, der Stromverbrauch wird ebenfalls von 450 W auf 425 W reduziert, eine Reduzierung um 5,9 %, alle anderen Kernspezifikationen bleiben gleich.

Aufgrund der leichten Erhöhung der Hauptfrequenz liegt die Leistung des 4090D in einigen Benchmark-Tests nur etwa 5 % unter der des 4090. Im Vergleich zu KI-Chips scheint dieser Abstand im akzeptablen Bereich zu liegen.

Die vier Sonderchips in Folge am Ende des Jahres 2023 haben die Peinlichkeit von Nvidia China ein wenig gemildert und verhindert, dass dem Unternehmen nach zwei Runden von Beschränkungen die Ware ausgeht Der Ausweg besteht darin, entweder inländische Chips zu kaufen, Server im Ausland zu bauen oder H100/200 und A100 über inoffizielle Kanäle zu kaufen, was keine andere Wahl hat, als sich unter inländischen Herstellern zu verbreiten.

Lao Huangs Messerfähigkeiten

Heimwerker, die mit Gaming-GPUs vertraut sind, werden mit Lao Huangs Messerfähigkeiten nicht allzu unbekannt sein.

Nehmen Sie ein relativ aktuelles Beispiel: Um die Produktlinie besser zu differenzieren und auf die Einführung neuer Produkte aus AMDs RX5000-Serie nebenan zu reagieren, brachte Nvidia die RTX 20 Super-Serie auf den Markt.

Obwohl sie ebenfalls auf TU106- und TU104-Kernen basieren, hat NVIDIA diese beiden Kerne verwendet, um fünf Grafikkarten herauszuarbeiten, nämlich RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super und RTX 2080. Unter ihnen ist der Abstand am geringsten Der theoretische Leistungsunterschied zwischen der TU106-Kern-RTX 2060 Super und der RTX 2070 beträgt nur etwa 5 %, und auch die tatsächlichen Laufergebnisse und Spieletests liegen sehr nahe beieinander. Man kann sagen, dass Nvidia die Kastration auf die Spitze getrieben hat.

Heutzutage sind die speziell modifizierten Chips, die Nvidia für China produziert, nichts anderes als eine Wiederholung der Vergangenheit und eine Rückkehr zum alten Geschäft.

Neben dem eingangs erwähnten B20 will Nvidia sein Können auch im Consumer-Markt unter Beweis stellen. Berichten zufolge soll im Januar 2025 die RTX 5090D auf den Markt kommen, eine reduzierte Version der RTX 5090 wird voraussichtlich auf der Blackwell-Architektur von Nvidia basieren. Die Verwendung des 4NP-Prozesses von TSMC könnte die Kernspezifikationen reduzieren, um US-Exportbeschränkungen zu umgehen.

Wenn man diese beiden gemunkelten Chips mitzählt, hat NVIDIA in China bereits ein riesiges Sonderangebot: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Einige Leute sind recht optimistisch, was die Aussichten dieser Sondereditionschips angeht. Die Forschungsorganisation SemiAnalysis schätzt, dass Nvidia in diesem Jahr voraussichtlich mehr als 1 Million H20-Chips im Wert von mehr als 12 Milliarden US-Dollar verkaufen wird.

Aber Nvidia muss sich immer noch große Sorgen machen. Laut einem Bericht von Jeffries-Analysten ist es „sehr wahrscheinlich“, dass die Vereinigten Staaten bei ihrer jährlichen Überprüfung der Halbleiter-Exportkontrollen im Oktober den Verkauf von Nvidia-H20-Chips nach China verbieten. Der Analyst sagte, dass das Verbot möglicherweise durch „bestimmte Produkte“ erfolgt Verbote, niedrigere Rechenkapazitätsobergrenzen und/oder begrenzte Speicherkapazität“ umzusetzen.

Darüber hinaus basieren künstlich hergestellte Compliance-Karten wie H20 im Wesentlichen auf der Kastration vorhandener Kerne. Das Gleiche gilt für B20. Es hätte als Kern von H200 und B200 verwendet werden können, kann aber nur noch zum Verkauf von günstigeren Spezialprodukten verwendet werden Editionen, und die Verkaufsdauer dürfte nur mehr als ein Jahr betragen, es ist also ein verlustbringendes Geschäft, egal wie man es betrachtet.

Aber Nvidia kann nur sein Bestes geben, um die Regeln und den Markt in Einklang zu bringen. Aber wie viele Unternehmen in China sind bereit, für die immer wieder abgeschnittenen Sondereditionschips zu zahlen?