Belegung

Der alte Huang macht einen weiteren überraschenden Schritt!Der erste „Special Edition“-GB20-Server wird auf den Markt gebracht, der möglicherweise nächstes Jahr auf den Markt kommt

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Neuer Weisheitsbericht

Herausgeber: Redaktion

[Einführung in die neue Weisheit]Ausländische Medien verbreiteten die Nachricht, dass Nvidia im nächsten Jahr einen auf den chinesischen Markt zugeschnittenen KI-Chip auf den Markt bringen und sogar einen passenden Server entwickeln wird. Dies ist das erste Mal in der Geschichte von Nvidia.

Der Kampf zwischen Nvidia und dem US-Handelsministerium ist erneut eskaliert!

Unter den US-Exportkontrollen entwickelt Lao Huang weiterhin alternative Strategien und es findet ein Katz-und-Maus-Spiel statt.


Nach der Einführung neuer Exportkontrollbestimmungen war Lao Huang nicht in der Lage, auf dem chinesischen Markt Geld zu verdienen.

Seit Januar dieses Jahres gelten die neuen Exportbestimmungen seit genau einem Jahr und der Anteil des chinesischen Marktes am Umsatz von Nvidia ist auf 17 % gesunken. Vor zwei Jahren lag dieser Wert noch bei 25 %+.

Angesichts der Regulierung hat Nvidia immer wieder speziell auf China zugeschnittene „Special Edition“-Chips auf den Markt gebracht. Diese Chips mit abgeschwächter Leistung verkaufen sich jedoch oft nicht gut.

Die Verkäufe des H20, die zuvor einen schlechten Start hatten, begannen gerade zu steigen, aber Nvidia war schockiert, als er die schlechten Nachrichten hörte –

Jefferies-Analysten gaben letzte Woche in einem Forschungsbericht bekannt, dass das US-Handelsministerium im Oktober seine jährliche Überprüfung der Exportbeschränkungen für Halbleiter durchführen wird und möglicherweise den Export von H20-Chips verbietet.

Die Aufsicht nimmt weiter zu, und dieses Mal zeigte Lao Huang sein Bestes.

Es brachte nicht nur den neuen Flaggschiff-KI-Chip B20 auf den Markt, sondern befürchtete auch, dass dieser nicht einfach zu bedienen sein würde, sondern brachte auch den unterstützenden Server GB20 auf den Markt.


Anhand des Namens ist es nicht schwer zu erraten, dass es sich beim B20 um eine Variante des Blackwell B200 handelt, die Nvidia im März dieses Jahres herausgebracht hat.

Als bisher schnellste GPU kann die B200 bestimmte Aufgaben bis zu 30-mal schneller verarbeiten als ihr Vorgänger. (z. B. den Chatbot Antworten generieren lassen)

Mit dem „Special Edition“ B20-Chip hat das leider nichts zu tun...

Der B20, der unter den Beschränkungen der US-Exportkontrollpolitik entstand, soll ein Einstiegsprodukt sein, im scharfen Gegensatz zum B200 mit branchenführender KI-Leistung.

Obwohl der B20 der Quelle zufolge bei der Verarbeitung von KI-Berechnungen langsamer sein wird als der B200, kann die Installation einer großen Anzahl von Chips zusammen im GB20-Server dieses Manko teilweise ausgleichen.

Dadurch wird sichergestellt, dass Nvidia im Wettbewerb mit chinesischen Produkten eine gewisse Wettbewerbsfähigkeit behält und gleichzeitig die von den US-Exportkontrollen geforderte Obergrenze der Chip-Rechenleistung einhält.

Unter Kontrolle spielt sich ein „Katz-und-Maus-Spiel“ ab

Seit Ende 2022 hat Nvidia seine Chips immer wieder für den chinesischen Markt umkonfiguriert und dabei auf die Bedürfnisse chinesischer Kunden zugeschnitten, die Chips für die Entwicklung von LLM benötigen, und versucht, für chinesische Kunden attraktiv zu bleiben und gleichzeitig die US-Vorschriften einzuhalten.

Im Oktober 2022 verbot die US-Regierung den Verkauf von Nvidias A100 und H100, den damals fortschrittlichsten Chips für künstliche Intelligenz.

Einige Monate später brachte Nvidia zwei Alternativprodukte, A800 und H800, für den chinesischen Markt auf den Markt.

Weniger als ein Jahr später aktualisierte das US-Handelsministerium erneut seine Exportkontrollmaßnahmen und verhängte Beschränkungen für diese beiden Chips.

Nvidia reagierte schnell,


Unter anderem bietet der H20-Chip eine begrenzte Leistung, aber eine höhere Verbindungsgeschwindigkeit. Mit Speicher mit hoher Bandbreite und ausgereifter Softwareunterstützung bringt er eine bessere Leistung.

Obwohl die anfänglichen Verkaufszahlen schlecht waren, entscheiden sich immer mehr chinesische Kunden für den Kauf dieses Chips.

Nach Angaben von vier Personen, die direkt am Verkauf von Nvidia-Chips in China beteiligt sind, haben chinesische Unternehmen mehr als 500.000 H20-Chips im Gesamtwert von fast 5,8 Milliarden US-Dollar bestellt und werden im Jahr 2024 ausgeliefert.

Das Forschungsunternehmen SemiAnalysis hat außerdem optimistische Schätzungen abgegeben, dass Nvidia in diesem Jahr mehr als 1 Million H20-Chips im Wert von mehr als 12 Milliarden US-Dollar in China verkaufen wird.

Aber wie bereits erwähnt, sieht sich dieses Geschäft neuen Bedrohungen durch das Handelsministerium ausgesetzt. Wenn die Vorschriften zum Jahresende angepasst werden, kann es sein, dass H20 vom Verkauf ausgeschlossen wird.

Dieses Verbot könnte viele Formen annehmen, darunter produktspezifische Verbote, die Reduzierung der Rechenleistung eines Chips oder die Begrenzung seiner Speicherkapazität.

Schließlich ist aufgrund der makroökonomischen Lage davon auszugehen, dass die Vereinigten Staaten weiterhin Druck auf die Exportkontrollen im Halbleiterbereich ausüben werden.

Die Vereinigten Staaten wollen von den Niederlanden und Japan, dass sie die Lieferung von Ausrüstung zur Chipherstellung nach China weiter einschränken, hieß es aus Quellen.


Unter der zunehmenden Kontrolle könnten immer mehr „Sondereditionen“ erscheinen.


Gerüchten zufolge entwickelt Nvidia auch eine neue Flaggschiff-Gaming-Grafikkarte, die RTX 5090D.


Die Grafikkarte wird speziell für den chinesischen Markt entwickelt und ist ein Nachfolger der RTX 4090D, der ersten verbraucherorientierten Grafikkarte, die Exportstandards erfüllt.

Die Chipleistung reicht nicht aus, der Server muss das ausgleichen

Die spezifischen Spezifikationen von B20 stehen noch nicht fest, aber sicher ist, dass es die „Obergrenze“ der US-GPU-Exportpolitik definitiv nicht durchbrechen wird.

Genau wie bei seinen alten Vorgängern – dem zuvor eingeführten H20, L20 und L2 – kann die Leistung dieser drei Chips als „episch“ bezeichnet werden. Nicht nur ist die Leistung schlecht, sondern sie sind auch nur mit einer Restversion von NVLink ausgestattet. verbinden.

TPP und PD sind zwei Hauptindikatoren für den Verschluss der Kehle

Die Vereinigten Staaten haben strenge Leistungsvorschriften für Chinas GPU-Exporte und verwenden einen Indikator namens „Total Processing Power“ (TPP).

Diese Metrik berücksichtigt die TFLOPS und die Genauigkeit der GPU-Rechenleistung. Insbesondere die Multiplikation von TFLOPS (ohne Sparsity) mit der Genauigkeit (in Bits) ergibt TPP.

Das aktuelle Limit liegt bei 4800 TPP. Was bedeutet das?

Nehmen wir die bisherigen NVIDIA-Produkte als Referenz: Hopper H100 und H200 haben diesen Standard weit übertroffen. Der TPP beider GPUs hat 16.000 erreicht, was mehr als dem Dreifachen der angegebenen Obergrenze entspricht.


Selbst die RTX 4090 übertrifft mit ihrer FP8-Rechenleistung von 660,6 TFLOPS das Limit.

Die leistungsstärkste Nvidia-Desktop-GPU, die die 4800-TPP-Grenze einhält, ist die RTX 4090D, die speziell für die Einhaltung von Exportbeschränkungen entwickelt wurde.


Blackwell hat einen neuen Maßstab in Sachen Rechenleistung gesetzt: Seine Dual-Chip-Lösung dürfte rund 4.500 TFLOPS FP8-Rechenleistung ausstoßen, was dem 7,5-fachen der Exportgrenze entspräche.

Mit anderen Worten: Die Leistung von B20 wird weniger als 1/7 der Leistung von Blackwell B200 betragen!

Darüber hinaus unterliegt B20 zusätzlichen Einschränkungen – den „Performance Density“ (PD)-Einschränkungen.

Hierbei handelt es sich um eine Einschränkung, die speziell für Rechenzentrums-GPUs in den Vereinigten Staaten gilt, und Verbraucher-GPUs sind davon nicht betroffen.

Der PD-Indikator kann durch Division des TPP-Scores durch die Chipgröße ermittelt werden. Der PD von nach China exportierten GPUs darf nicht höher als 6,0 sein.

Diesem Indikator zufolge können GPUs der RTX 40-Serie (Ada Lovelace-Architektur) nicht mehr in Rechenzentren verwendet werden.

Blackwell ist in Bezug auf Dichte und Leistung offensichtlich besser als Ada Lovelace.

Mit anderen Worten: Nvidia muss die Leistung des B20 stark einschränken oder einen größeren Anteil an Chips verwenden, um die entsprechenden Vorschriften einzuhalten.

Laut Tom's Hardware wird der B20 der Nachfolger der Einstiegs-KI-GPUs A30 und H20 von Nvidia sein.

Am Beispiel von H20 beträgt seine FP16-Rechenleistung nur 296 TFLOPS, TPP 2368, PD nur 2,90 und H100/H200 1979 TFLOPS.


Gleichzeitig hat der A30 einen TPP-Score von 2640 und einen PD-Score von 3,20, was etwas höher ist als der H20.

Es ist ersichtlich, dass die von Nvidia für den chinesischen Markt gebaute KI-GPU zwar noch Raum für Leistungsverbesserungen bietet, der Platz jedoch sehr begrenzt ist.

Im besten Fall könnte Nvidia versuchen, eine GPU mit einem TPP zwischen 4000 und 4500 und einer Die-Größe von 800 Quadratmillimetern zu entwickeln.

GB20: Geben Sie unser Bestes, um die Leistung von B20 zu schonen

Um den kommenden B20 effizienter zu machen, setzt Nvidia auf Strategien, die es bereits beim H20 verwendet hat, wie etwa die Aufrüstung der Speicherkapazität, da Speicherchips keinen aktuellen Exportkontrollen unterliegen.

Nach Angaben zweier an der Entwicklung des Servers beteiligter Personen arbeitet Nvidia daran, die Geschwindigkeit der Datenübertragung zwischen Speicher und B20-Prozessoren zu erhöhen, damit große Energiedatensätze schneller verarbeitet werden können.

Darüber hinaus wird Nvidia auch seine NVLINK-Technologie (die eine schnelle Kommunikation zwischen verschiedenen Chips ermöglicht) und Kühllösungen im GB20-Rack-Design einsetzen.

Das Duo fügte hinzu, dass dies voraussichtlich die Nutzung von B20-Chips und die Wirksamkeit von GB20-Rechenclustern bei der Förderung künstlicher Intelligenz erhöhen werde.

Mit dem GB20-System können Kunden KI-Training und Inferenz durchführen, indem sie mehrere Chips effizienter parallel betreiben.

Bevor der GB20 vorgestellt wurde, sagte Tom's Hardware mutig voraus, dass der B20 ein schwer zu verkaufender Chip sein würde.

Aber jetzt, mit dem Segen von GB20, scheint es neue Hoffnung zu geben.

Verweise:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- Vorschriften

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules