ニュース

黄老はまた驚くべき行動をとります!最初の「特別版」GB20 サーバーが発売され、来年発売される可能性があります

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


新しい知恵のレポート

編集者:編集部

【新しい知恵の紹介】海外メディアは、Nvidiaが中国市場向けにカスタマイズされたAIチップを来年発売し、それに適合するサーバーも開発するとのニュースを報じた。これはNvidiaの歴史上初めてだ。

Nvidia と米国商務省の間の争いが再び激化しました。

米国の輸出規制下で老黄氏は代替戦略を考案し続けており、いたちごっこが続いている。


新しい輸出管理規制の施行後、ラオファンは中国市場で利益を得ることができなくなった。

今年1月の時点で、新たな輸出規制が施行されてからちょうど1年が経過し、NVIDIAの収益に占める中国市場の割合は17%まで低下した。 2 年前、この数字はまだ 25% 以上でした。

規制に直面して、NVIDIA は中国向けにカスタマイズされた「特別版」チップを継続的に発売してきましたが、性能が低下したこれらのチップは売れないことがよくあります。

以前は出足が悪かった H20 の売上は増加し始めたところでしたが、Nvidia は悪い知らせを聞いてショックを受けました—

ジェフリーズのアナリストらは先週の調査報告書の中で、米商務省が10月に半導体輸出規制の年次見直しを実施し、H20チップの輸出を禁止する可能性があることを明らかにした。

監督はエスカレートし続けており、今回はラオ・ファンが最善を尽くした。

同社は、新しい主力 AI チップ B20 を発売しただけでなく、それが使いにくいことを懸念して、サポート サーバー GB20 も発売しました。


名前から、B20 が今年 3 月に Nvidia によってリリースされた Blackwell B200 の亜種であることを推測するのは難しくありません。

B200 はこれまでで最速の GPU として、前モデルよりも最大 30 倍速く特定のタスクを処理できます。 (例: チャットボットに回答を生成させる)

残念ながら、これは「特別版」B20 チップとは何の関係もありません...

米国の輸出管理政策の制約の下で誕生したB20は、業界トップクラスのAI性能を備えたB200とは対照的に、エントリーレベルの製品となる運命にある。

ただし、関係者によると、B20はAI計算の処理がB200よりも遅いものの、GB20サーバーに多数のチップをまとめて搭載することで、この欠点を部分的に補うことができるという。

これにより、エヌビディアは中国製品と競合する際に一定の競争力を維持しながら、米国の輸出規制で求められるチップのコンピューティング能力の上限も遵守できるようになる。

制御下で「いたちごっこ」が繰り広げられる

2022年末以来、Nvidiaは中国市場向けにチップを繰り返し再構成し、LLM開発にチップを必要とする中国顧客のニーズをターゲットにし、米国の規制を遵守しながら中国顧客にとって魅力を維持しようと努めてきた。

2022年10月、米国政府は、当時最も先進的な人工知能チップであるNvidiaのA100とH100の販売を禁止した。

数か月後、Nvidia は中国市場向けに 2 つの代替製品、A800 と H800 を発売しました。

それから 1 年も経たないうちに、米国商務省は再び輸出管理措置を更新し、これら 2 つのチップに制限を課しました。

Nvidia は迅速に対応し、


その中でも、H20 チップはパフォーマンスが限られていますが、高帯域幅メモリと成熟したソフトウェア サポートにより、より高い接続速度を実現します。

当初の売上は低調でしたが、このチップを購入する中国人顧客が増えています。

中国での Nvidia チップの販売に直接関与している 4 人の関係者によると、中国企業は総額 58 億米ドル近くに相当する 50 万個以上の H20 チップを注文しており、2024 年に納入される予定です。

調査会社セミアナリシスは、エヌビディアが今年中国で100万個以上のH20チップを販売し、その価値は120億米ドルを超えるだろうと楽観的な予測も立てている。

しかし、前述したように、このビジネスは商務省による新たな脅威に直面しています。年末にレギュレーションが調整されると、H20は販売禁止となる可能性がある。

その禁止は、製品固有の禁止、チップの計算能力の削減、メモリ容量の制限など、さまざまな形をとる可能性がある。

結局のところ、マクロ的な背景から、米国は今後も半導体関連の輸出規制に対して圧力をかけ続けると一般的に予想されている。

関係筋によると、米国はオランダと日本に対し、中国へのチップ製造装置の供給をさらに制限するよう求めている。


管理が強化されると、さらに多くの「特別版」が登場する可能性があります。


噂によると、Nvidia は新しい主力ゲーム用グラフィックス カードである RTX 5090D も開発しているとのことです。


このグラフィックス カードは中国市場向けに特別に設計され、輸出基準を満たす初の消費者向けグラフィックス カードである RTX 4090D の後継製品となります。

チップの性能が足りないのでそれを補うサーバーが必要

B20の具体的な仕様はまだ決まっていないが、確かなことは、米国のGPU輸出政策の「天井」を絶対に突破しないということだ。

以前に発売された H20、L20、L2 と同様に、これら 3 つのチップのパフォーマンスは「素晴らしい」と言えます。パフォーマンスが低いだけでなく、NVLink の残りのバージョンしか搭載されていません。接続する。

TPP と PD のどをロックする 2 つの主要な指標

米国は中国のGPU輸出に対して厳しい性能規制を設けており、「総処理能力」(TPP)と呼ばれる指標を使用している。

このメトリックでは、TFLOPS と GPU コンピューティング能力の精度が考慮されます。具体的には、TFLOPS (スパースなし) と精度 (ビット単位) を乗算すると、TPP が得られます。

現在の制限は 4800 TPP に設定されていますが、これは何を意味しますか?

NVIDIA の従来製品を参考にすると、Hopper H100 と H200 はこの基準を大幅に上回り、両 GPU の TPP は規定の上限の 3 倍を超える 16,000 に達しました。


RTX 4090 でさえ 660.6 TFLOPS の FP8 演算能力で制限を超えています。

4800 TPP 制限内に収まる最も強力な Nvidia デスクトップ GPU は RTX 4090D で、特に輸出制限に準拠するように設計されています。


ブラックウェルはコンピューティングパフォーマンスの新たなベンチマークを設定し、同社のデュアルチップソリューションは約4,500TFLOPSのFP8コンピューティングパワーを出力する可能性があり、これは輸出制限の7.5倍となる。

つまり、B20 の性能は Blackwell B200 の性能の 1/7 以下になります。

それだけでなく、B20 は追加の制限、つまり「パフォーマンス密度」(PD) 制限にも直面しています。

これは特に米国のデータセンター GPU に課せられた制限であり、コンシューマ GPU はこの制限の影響を受けません。

PD 指標は、TPP スコアをチップ サイズで割ることによって取得できます。中国に輸出される GPU の PD は 6.0 を超えてはなりません。

この指標によると、RTX 40 シリーズ GPU (Ada Lovelace アーキテクチャ) はデータセンターで使用できなくなります。

ブラックウェルは、密度とパフォーマンスの点でエイダ・ラブレスよりも明らかに優れています。

言い換えれば、Nvidia は関連する規制に準拠するために、B20 のパフォーマンスを厳しく制限するか、より多くの割合のチップを使用する必要があります。

Tom's Hardware によると、B20 は Nvidia の A30 および H20 エントリーレベル AI GPU の後継となるそうです。

H20 を例にとると、FP16 の計算能力はわずか 296 TFLOPS、TPP は 2368、PD はわずか 2.90 ですが、H100/H200 は 1979 TFLOPS です。


同時に、A30 の TPP スコアは 2640、PD スコアは 3.20 で、H20 よりもわずかに高くなります。

Nvidiaが中国市場向けに構築したAI GPUには性能向上の余地があることがわかりますが、スペースは非常に限られています。

最良のシナリオでは、Nvidia は 4000 ~ 4500 の TPP と 800 平方ミリメートルのダイ サイズを備えた GPU の作成を検討する可能性があります。

GB20: B20のパフォーマンスを維持するために最善を尽くします

次期 B20 をより効率的にするために、メモリ チップは現在の輸出規制の対象ではないため、NVIDIA はメモリ容量をアップグレードするなど、H20 で使用した戦略を採用しています。

このサーバーの開発に携わった2人の関係者によると、Nvidiaは大規模なエネルギーデータセットをより迅速に処理できるよう、メモリとB20プロセッサ間のデータ転送速度の向上に取り組んでいるという。

それだけでなく、Nvidia は、GB20 ラック設計で自社の NVLINK テクノロジー (異なるチップ間の高速通信を可能にする) と冷却ソリューションも使用します。

これにより、B20 チップの利用率が高まり、人工知能を強化する GB20 コンピューティング クラスターの有効性が高まることが期待されると両氏は付け加えた。

GB20 システムにより、顧客は複数のチップをより効率的に並行して実行することにより、AI のトレーニングと推論を実行できるようになります。

GB20 が公開される前、Tom's Hardware は B20 が販売が難しいチップになると大胆に予測していました。

しかし今、GB20 の祝福により、新たな希望が見えてきました。

参考文献:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export-規則

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-スカート-us-rules