ニュース

3兆のチップ企業も生き残ろうとしているのでしょうか?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidiaは中国市場向けに特殊なAIチップを再び生産する予定だ。

ロイター通信の最新報道によると、事情に詳しい関係者によると、インテルは中国市場向けに、現在の米国輸出規制の要件を満たし、国内のエヌビディア特殊チップのラインナップに新たなメンバーを加える新たな主力AIチップを開発中だという。

Nvidia が今年 3 月に「Blackwell」シリーズをリリースし、今年後半に量産される予定であることは言及する価値があります。Nvidia によると、B200 は特定のタスクにおいて前世代より 30 倍高速です。現在利用可能なトップ AI チップの一部。

この新しい特別なフラッグシップチップはB200にも関連しており、ネーミングから判断すると、NVIDIAは中国の主要販売パートナーの1つであるInspur Groupと協力してこのチップを発売し販売する予定であると述べた。 B200 の機能がいくつかある場合があります。

この B20 を数えると、わずか 1 年余りの間に、Nvidia は中国市場向けに 7 ~ 8 個の特殊チップを発売しました。

A800とH800

2022年10月7日、米国政府は中国への一部の半導体チップやチップ製造装置の供給停止を含む一連の輸出規制措置を発表した。

フォトリソグラフィー機械などの生産設備に影響を与えることに加えて、NVIDIAやAMDなどの米国企業による中国へのそのようなチップの販売の禁止や、中国の人工知能の制限など、高度なプロセスの下でのハイコンピューティングおよび人工知能チップへの中国のアクセスも制限される。 . チップ会社はアメリカの技術で海外のファブ工場でテープアウトを行っています。

この輸出制限により、Nvidia と AMD の両方が影響を受けました。

この制限が導入された後、Nvidiaは、この禁止は機械学習タスクを高速化するように設計されたA100およびH100チップに影響を及ぼし、2022年にリリースされる主力チップH100の開発完了を妨げる可能性があると述べた。同四半期中の中国での影響を受けたチップの売上高は4億ドルに達したと指摘し、中国企業がエヌビディアの代替製品を購入しないことに決めれば、この資金は無駄になると指摘した。

では、米国の輸出規制は具体的にどのように Nvidia チップを制限するのでしょうか?

2022 年 10 月 7 日に米国商務省が発行した高度コンピューティング集積回路の輸出制限規則 (ECCN 3A090 および 4A090) によると、規制品目リストは以下の条件を満たす必要があります。

a. すべての入出力の合計双方向転送速度が 600 GB/s 以上にプログラム可能な、揮発性メモリを除く集積回路、および以下の集積回路のいずれか。

a.1. 機械語命令を実行する 1 つ以上のデジタル プロセッサ ユニット、各演算のビット長に TOPS の処理性能を乗算し、すべてのプロセッサ ユニットの合計が 4800 以上である。

a.2. 1 つ以上のデジタル「生のコンピューティング ユニット」 (3A090.a.1 の TOPS の計算に関連するマシン命令の実行を支援するユニットを除く)、その演算ごとのビット長はすべてのコンピューティング ユニットの合計で乗算されます。 TOPSの処理性能は4800以上。

a.3. 処理パフォーマンスが TOPS の 8 倍として計算され、すべてのコンピューティング ユニットの合計が 4800 以上である 1 つ以上のシミュレーション、多値またはマルチレベルの「オリジナル コンピューティング ユニット」。

a.4. 3A090.a.1、3A090.a.2、および 3A090.a.3 に従って計算された合計が 4800 以上になる、デジタル プロセッサ ユニットと「オリジナルのコンピューティング ユニット」の組み合わせ。

3A090.a に記載されている集積回路には、グラフィックス プロセッシング ユニット (GPU)、テンソル プロセッシング ユニット (TPU)、ニューラル プロセッサ、メモリ プロセッサ、ビジョン プロセッサ、テキスト プロセッサ、コプロセッサ/アクセラレータ、適応型処理デバイス、フィールド プログラマブル ロジック デバイスが含まれます。 (FPLD) および特定用途向け集積回路 (ASIC)。

この規制によると、最も重要なのはチップの相互接続速度の制限であることは明らかであり、NVIDIA の売れ筋の A100 は正確に制限内に収まり、そのチップ間転送速度は 600GB/s に達しました。おそらく米国商務省は、ある程度、A100 に基づいてこの制限を指定したのでしょう。

輸出規制に対処するために、NVIDIA はすぐに A100 ~ A800 の代替品を去勢しました。米国での禁止は 2022 年 10 月 7 日に正式に発表され、その 1 か月後に NVIDIA は新しい規制に適応した A800 を開発したと言えます。以前は地域の状況に適応していましたが、現在は政策の状況に適応しています。

仕様によれば、NVIDIA A800 は Ampere A100 GPU と同じチップ アーキテクチャを使用します。 40 GB と 80 GB の 2 つの PCIe バージョンと 80 GB SXM バージョンの 3 つのバージョンが用意されており、これらの GPU は最大 9.7 TFLOP の FP64、19.5 TFLOP の FP64 Tensor コア、19.5 TFLOP の FP32、156 TFLOP を提供します。 (312 TFLOPs スパーシティ) TF32、312 TFLOPs (624 TFLOPs スパーシティ) BFLOAT16 および 624 TOPS (1248 TOPs スパーシティ) INT8 パフォーマンス。 40 GB バージョンには最大 1.555 TB/秒の帯域幅の HBM2 メモリが搭載されており、80 GB バージョンには最大 2 TB/秒の帯域幅の HBM2e が搭載されています。

もちろん、限られた需要を満たすために、帯域幅は当初の 600GB/s から 400GB/s に必然的に削減されました。Nvidia の広報担当者はロイターへの声明で次のように述べています。中国の顧客向けの A100 GPU の代替品である A800 は、米国政府の輸出規制削減に関する明示的なテストを満たしており、その基準を超えてプログラムすることはできません。」

CCS Insightのアナリスト、ウェイン・ラム氏は、「A800は、商務省による最近の貿易制限を回避するために設計されたA100 GPUを再パッケージ化したもののようだ」とコメントし、中国では8が幸運な数字であると指摘した。

「中国はエヌビディアにとって重要な市場であり、貿易制限を回避するために製品を再構成することはビジネス上合理的だ」とラム氏は述べ、A800のチップ間通信能力は数千のチップを使用するデータセンターにとって大幅に低下すると述べた。

続く H100 では、Nvidia も追随して H800 を開発しました。 A100 では、Nvidia は GPU の 600 GB/秒の相互接続を 400 GB/秒に落とし、H100 でも同じことを行いました。報告によれば、H800 のチップ相互接続速度は、H100 の約半分、つまり 800 GB/s から 400 GB/s に低下しました。 A800 と比較すると、H800 のパフォーマンスの影響は大きくなります。結局、前者は 33% の削減にとどまり、後者は 50% も削減されました。

当時、NVIDIAの広報担当者は中国市場向けのH800とH100の違いを明らかにすることを拒否し、「当社の800シリーズ製品は輸出管理規制に完全に準拠している」とだけ述べた。

海外メーカーが A100 と H100 を必死に購入しているとき、国内メーカーは低構成の H800 と A800 しか選択できず、NVIDIA の特殊バージョンのチップにより、国内の大型 AI モデルの開発がある程度制限されています。

H20 および RTX 4090D

国内企業にとって、A800 と H800 には良い点と悪い点があります。悪い点は、インターネット帯域幅を遮断した後、これら 2 つのチップのパフォーマンスが少し低下し、トレーニング速度も大幅に遅くなることです。良い点も悪い点も両方あります。Zhengcheng のチャネルを通じて注文することもできますが、外国企業と比較するとチップのコストが高くなります。

しかし、A800とH800も1年も持たなかった。 2023 年 10 月 17 日、米国商務省は、2022 年 10 月 7 日に発行された、アドバンスト コンピューティング集積回路、半導体製造装置、スーパーコンピューティング アプリケーションおよび最終用途をサポートする品目の輸出を規制する新しい規制規則を発行しました。追加の更新。

その中で主なものは、制御パラメーターの変更です。暫定最終規則では、ECCN 3A090 で制限されたチップを識別するためのパラメーターとして「相互接続帯域幅」が削除され、代わりにチップが ECCN 3A090 で調整された 2 つのパラメーター (3A090.a および 3A090.a および3A090.b)、輸出は制限されます。

米国商務省の文書によると、改訂された 3A090.a 規制パラメータは、1 つ以上のデジタル処理ユニットを備えた集積回路を規制するもので、これらのユニットの「合計処理性能」は 4800 以上、つまり「合計処理性能」であることが求められています。 「パフォーマンス」が1600以上、「パフォーマンス密度」が5.92以上。新しい ECCN 3A090.b は、1 つ以上のデジタル処理装置を備えた集積回路を規制します。この集積回路は、「総処理性能」が 2400 以上 4800 未満、「性能密度」が 1.6 または 1.6 のいずれかの条件を満たす必要があります。または、「総合処理性能」が1600以上、かつ「性能密度」が3.2以上5.92未満である。

さらに、このルールは、制限しきい値を下回る人工知能機能を備えた消費者グレードの IC に対して、新しい「アドバンスト コンピューティングのライセンス例外通知」を作成するライセンス例外を作成します。この例外は、データ用に設計されたチップまたは販売されるチップの 2 つの製品に適用されます。 2 番目のチップはデータセンター用に設計または販売されていないチップで、「合計処理パフォーマンス」は 4800 以上です。

2022 年 10 月 7 日の規則と比較すると、新規則では、総合処理性能と性能密度の二重の規則に基づき、非去勢製品と去勢製品の両方が輸出規制の対象に含まれます。対象範囲では、A800 と H800 が影響を受けていますが、他の Nvidia 製品も推論市場向けの L40 と L40S、コンシューマ分野の RTX 4090 も禁止の対象となっています。

これは Nvidia にとって大きな打撃であり、当時 Nvidia が販売していた主流製品が輸出規制により中国で販売できなくなったことを意味します。これまでのデータセンター事業の収益は中国市場からのものであったことを知っておく必要があります。 Nvidia 全体の収益は約 20% ~ 25% に達し、2024 年度第 4 四半期には輸出規制により中国市場での収益は 1 桁にまで落ち込みました。

どうすることもできず、Nvidia は再びナタを振るうことしかできませんでした。

新しい規則のリリースから 1 か月後の 2023 年 11 月 16 日、NVIDIA は中国市場向けに特別に GPU チップを発売しました。H20、L20、および L2 は NVIDIA の Hopper アーキテクチャに基づいており、L20 と L2 は Ada に基づいています。建築。

このうち、2 つのチップ L20 と L2 は、それぞれ L40 と L4 に基づいて調整されており、古いアーキテクチャであり、推論や学習にはあまり使用されていないため、あまり注目されていません。 H20 は、新しい規制によりインターネット速度の制限がなくなり、900GB/s の完全な NVLink を実現しましたが、アナリストの Dylan Petal 氏の意見によれば、実際のパフォーマンスは大幅に割り引かれることになります。 H20 の使用効率は 90% に達しますが、実際のマルチカード相互接続環境におけるパフォーマンスはまだ H100 の 50% 近くにすぎません。

コンシューマ市場の RTX 4090 については、NVIDIA は昨年 12 月に、米国の輸出規制に準拠したこの特別なチップである RTX 4090D を発売しました。CUDA コアの点で去勢され、消費電力が削減されました。 12.8%、消費電力も 450W から 425W に削減され、5.9% 削減されました。その他のコア仕様はすべて同じです。

メイン周波数がわずかに増加したため、いくつかのベンチマーク テストでは、4090D のパフォーマンスは 4090 のパフォーマンスよりも約 5% 低いだけです。AI チップと比較すると、この差は許容範囲内であるようです。

2023年末に連続して4つの特殊チップが投入されたことで、エヌビディア中国の当惑はある程度軽減され、販売する商品がなくなることは避けられたが、2度の規制を経て、大企業も中小企業も同様だ。解決策は、国内のチップを購入するか、海外にサーバーを構築するか、非公式ルートで H100/200 と A100 を購入するかのいずれかであり、国内メーカーに普及するしかありません。

ラオ・ファンのナイフの腕前

ゲーム GPU に精通している DIY プレイヤーなら、Lao Huang のナイフ スキルにあまり馴染みがないでしょう。

比較的最近の例を挙げると、RTX 20 シリーズのリリースから 1 年後、製品ラインの差別化を強化し、隣の AMD の RX5000 シリーズからの新製品の発売に対応するために、Nvidia は RTX 20 Super シリーズを発売しました。

これらも TU106 および TU104 コアに基づいていますが、NVIDIA はこれら 2 つのコアを使用して、RTX 2060、RTX 2060 Super、RTX 2070、RTX 2070 Super、および RTX 2080 という 5 つのグラフィックス カードを切り出しました。その中で、最も小さなギャップは次のとおりです。 TU106コアのRTX 2060 SuperとRTX 2070の理論上の性能差はわずか5%程度で、実際の実行スコアやゲームテストでも非常に近い結果となっており、Nvidiaは極限まで去勢していると言える。

現在、Nvidia が中国向けに製造する特別に修正されたチップは、過去の繰り返しであり、古いビジネスへの回帰にすぎません。

冒頭で述べた B20 に加えて、NVIDIA はコンシューマー市場でもその腕前を披露する予定であるとの報道によると、RTX 5090 の縮小版である RTX 5090D が 2025 年 1 月に発売される予定です。 TSMCの4NPプロセスを使用すると、米国の輸出制限を回避するためにコア仕様が削減される可能性があります。

噂されているこれら 2 つのチップを数えると、NVIDIA はすでに中国で膨大な特別なラインナップを持っています: A800、H800、H20、L20、L2、RTX 4090D、B20、RTX 5090D、

一部の人々は、これらの特別版チップの見通しについて非常に楽観的ですが、研究機関のセミアナリシスは、エヌビディアが中国で今年 100 万個以上、120 億米ドル以上の価値のある H20 チップを販売すると予想しています。

しかし、NVIDIA にはまだ心配すべきことがたくさんあります。ジェフリーズのアナリストらの報告書によると、米国が10月に半導体輸出規制の年次見直しを実施する際、エヌビディアのH20チップの中国への販売が禁止される可能性が「非常に高い」とのことである。禁止、コンピューティング能力の上限の引き下げ、および/またはメモリ容量の制限」を実装する必要があります。

さらに、H20 のような人工的に製造されたコンプライアンス カードは、本質的には既存のコアの去勢に基づいています。これは B20 にも当てはまりますが、今では安価なスペシャルを販売するためにのみ使用できます。版数も多く、販売寿命も1年強と思われるため、どう考えても赤字事業である。

しかし、NVIDIA には、ルールと市場のバランスをとるために最善を尽くすしか方法がありません。しかし、何度も打ち切られる特別版チップの代金を支払う用意のある企業が中国にどれだけあるでしょうか。