ニュース

ming-chi kuo氏は、nvidiaがデュアルキャビネットバージョンgb200 (nvl36*2) aiキャビネットの開発を中止したと述べた

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

10 月 2 日の it house ニュースによると、ming-chi kuo 氏は昨日 (10 月 1 日)、市場投資説明会を発表しました。顧客のカスタマイズ要件がないため、nvidia は gb200 (2 nvl36) のデュアル キャビネット バージョンを提供しなくなったと報告されました。 )、シングル キャビネット バージョン gb200 nvl72 のみを提供しますが、シングル キャビネット バージョン nvl36 は当初の開発および出荷計画を維持しています。

it home は、ming-chi kuo 氏の会見情報を次のように添付します。

結論は:

この問題は、ai と nvidia の長期的な前向きな傾向に影響を与えることはありませんが、短期的には一部の市場参加者に nvidia とサプライチェーンの実行能力に疑問を抱かせる可能性があります。

nvidia は最近、ai サーバー製品のブループリントを頻繁に改訂していますが、これは nvidia が限られたリソースの中でサプライチェーンの実行、競争上の優位性、顧客のニーズの間でより良いバランスを実現したいと考えているからだと思います (nvl36*2 の開発中止はほんの一例です)。これは良いことであり、製品計画に対する nvidia のより現実的なアプローチを表していますが、変更プロセスにより一部の市場参加者はサプライ チェーンの混乱について混乱する可能性があります。

2025 年の blackwell サーバーの製品出荷構成は現時点であまり見通しが立たないため (数か月前、市場では一般的に nvl36、nvl72、nvl36*2 のみになると考えられていました)、アセンブリなどの一部のサプライヤーの 2025 年の見通しはと冷却が大きく影響します。

72gpu 2バージョンの比較:nvl72選択とnvl36中止の理由*2

開発リソースは限られています。当初の計画では、gb200 ケースを 3 つ(nvl36、nvl72、nvl36*2)同時に開発する予定でした。 11月中旬から開始される開発バージョン(開発ドロップ:devdrop)は、nvl72とnvl36*2に統合されることが予想されます(nvl36は「理論上」量産段階に入る準備ができているため)、2つの最終バージョンは、 2025 年 3 月中旬までに完了する予定です。品質保証 (qa)。しかし、nvl36 の開発には依然として不確実性があり、ましてや 2 つの 72 gpu バージョン (nvl72 と nvl36*2) の同時開発は不可能です。

nvl72 はデータセンターのスペースを節約します。nvl72 が sidecar の放熱設計の課題を適切に解決できれば、nvl36*2 よりも必要なキャビネットが 1 つ少なくなり、データセンターのスペース効率が向上します。

nvl72 の方が推論効率が優れています。ソフトウェアの並列化設計の利点により、nvl72 と nvl36*2 の間で ai llm トレーニング結果にほとんど差がありません。ただし、設計の並列化が困難または容易ではない推論プロセス (自己回帰モデルなど) では、nvl72 のパフォーマンスが nvl36 を上回りやすくなります*2。

主要な顧客の好み。たとえば、microsoft は nvl36*2 よりも nvl72 を好みます。

公約を履行します。 nvidia は、限られたリソースで公約を果たすため、nvl72 のシングルキャビネット バージョンを常に宣伝に注力してきました。nvl72 の開発優先度は nvl36 よりも高くなります*2。

nvl72 の開発は前例のない技術的課題に直面しており、現在の量産スケジュールの見通しはまだ低い

nvl72 の開発における最大の課題は、主に 132kw という tdp (熱設計ポイント) 要件にあり、これは nvidia 史上最高の電力消費量となるため、サプライ チェーンは前例のない技術的問題を解決するためにさらに時間が必要です。

tdp は連続動作時の平均消費電力を指し、不適切な設計により瞬間最大消費電力 (nvidia では edp (電気設計ポイント) と呼ばれます) が tdp よりも高くなる場合、2 つ以上のサイドカーが必要になる場合があることに注意してください。そうなると、放熱設計の複雑さや量産の難易度が高くなるだけでなく、データセンターの省スペース化というnvl72のメリットが失われてしまいます。

sidecar のもう 1 つの設計課題は、接近温度を 5 ~ 10°c 以内で安定して制御することです。この基準が緩和されると、システムの安定性に影響が出る可能性があります。

上記の高消費電力の課題には、sidecar だけでなく、すべてのコンポーネントとシステム設計が関係していることに注意してください。

私の最新のサプライチェーン調査では、nvl72 の量産スケジュールは 2025 年下半期以降になる可能性があると指摘しています (nvidia の楽観的な目標は 2025 年上半期です)。