ニュース

「第3のメインチップ」dpu:今後3年間が商用実装の猶予期間となる

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

データセンターにおける cpu と gpu に次ぐ 3 番目の主要チップとして、dpu は近年人気が高まっています。
dpu、つまりデータ プロセッサは、強力なネットワーク処理機能に加えて、セキュリティ、ストレージ、ネットワーク オフローディング機能を備えており、cpu のコンピューティング能力を解放して、ネットワーク プロトコル処理、データの暗号化と復号化などのデータ処理タスクを完了できます。 cpuが苦手なデータ圧縮や、各種リソースを個別に管理、拡張、スケジューリングするなど、「cpuではできない、gpuではできない」タスクを処理し、データセンターのコスト削減と効率化を実現します。改善。
ai 時代には、インテリジェント コンピューティング センターが処理する必要があるデータの量が爆発的に増加しており、dpu はインテリジェント コンピューティング センターの効率的なコンピューティング能力を解放し、インフラストラクチャのコスト削減と効率向上の問題を解決できます。徐々に増えてきています。
three us in one、インテリジェント・コンピューティングの時代により適したソリューション
「dpu の概念は 4 年前に nvidia によって宣伝されました。イスラエルの会社 mellanox を買収した後、nvidia は cpu、gpu、dpu を含む完全なデータセンター ソリューションを提供する業界初のプロバイダーになりました。」と xinqi との独占インタビューで述べています。 , yuanの創設者lu sheng氏は、xinqiyuanは2018年に遡ってdpuの研究開発に取り組んだ最も初期の国内メーカーの1つであり、当時はsmartnicとも呼ばれていたと述べました。
「以前は、従来のネットワーク カードがネットワーク伝送機能を搭載していました。その後、スマート ネットワーク カードが誕生し、4 年前に徐々に dpu に進化しました。」同社はインテリジェント コンピューティング チップの研究開発と設計に重点を置いていると first finance に語った。
2020 年に nvidia が発表した dpu 製品戦略では、dpu を cpu と gpu に次ぐデータセンターの「第 3 のメインチップ」と位置付け、それ以来 dpu コンセプトが爆発しました。
現在、dpu はデータ センターの新たな専用プロセッサとなり、データ センター内のセキュリティ、ネットワーク、ストレージのタスクを高速化するように特別に設計されており、高帯域幅、低遅延のデータ集約型コンピューティング シナリオに電力を提供します。 dpu の中核的な役割は、もともと cpu によって処理されていたネットワーク、ストレージ、セキュリティ、および管理タスクを引き継ぎ、それによって cpu リソースを解放し、データ セキュリティとプライバシー保護を強化することです。
「nvidia のインテリジェント コンピューティング センター ソリューションは、実際には 3 つの u が統合されています。3 年前の nvidia の dgx a100 サーバーとその後の dgx gh200 シリーズには、すべて cpu、gpu、dpu が含まれています。もちろん、dpu には他のコンポーネントもあります。スマート ネットワークもあります」 rdma などのカードは、実際には dpu として分類できますが、この観点から見ると、現在の業界のリーダー、または一般に受け入れられている方向は、「gpu と dpu が連携して動作する」というものです。 zhang yu 氏は、一般的なデータセンター ソリューションは、cpu、ストレージ、ネットワークを組み合わせたものであると述べました。一部のクラウドネイティブ シナリオでは、低遅延で高スループットのデータ ネットワーク処理も必要であり、インテリジェント コンピューティング シナリオではネットワークが必要です。処理パフォーマンス要件は次のとおりです。より高い。
「cpu を全体的な制御に使用される脳に喩えると、gpu は筋肉に似ており、安定した豊富な並列計算能力を提供するために使用されます。一方、dpu はデータを転送する血管や神経に似ています。 gpu は、制御命令の交換とプロトコル変換を完了するために、 を計算して dpu を通じてサーバーに転送する必要があります」と zhang yu 氏は述べています。
「複数の pu の連携は、実際にはコンピューティング アーキテクチャ全体のアップグレードです。これまでの汎用 cpu ベースのアーキテクチャから、アクセラレータ ベースのコンピューティング アーキテクチャへ、連携によってコンピューティング ソリューション全体の費用対効果が向上します」 zhang yu 氏は、「現在、テクノロジーの面では、dpu は徐々に成熟しており、ネットワーク セキュリティの暗号化と復号化、ゼロ トラスト、およびネットワークの境界も比較的成熟しています。オフロードは基本的にdpuが安定して搭載できる機能となっています。」
設備投資やエネルギー消費量を削減し、一定のコストパフォーマンスを実現
cpu のオフロード エンジンとしての dpu の最も直接的な役割は、ネットワーク仮想化やハードウェア リソース プーリングなどのインフラストラクチャ層のサービスを引き継ぎ、cpu のコンピューティング能力を上位層のアプリケーションに効果的に解放することです。インテリジェント コンピューティング センターの計算能力を解放し、エネルギー効率を向上させます。
「nvidia は以前、前世代の生成 ai サーバーの計算能力チップの効率が設計能力の 40% にすぎないと認めました。私たちが測定したところ、それはわずか 30% を超えていました。これは、計算能力の大部分がアイドル状態であることを意味します。その理由は、クラスター内では、計算によって生成された中間変数がデータ同期を完了するまでに時間がかかるため、ネットワーク チャネルの容量によってコンピューティング パワー ベースの上限が制限され、まさにここに真の値が求められるためです。 dpu が嘘をついたことで、dpu が再び最前線に押し上げられました。
データ量が爆発的に増加する ai 時代において、dpu は、低遅延、大帯域幅、高速データ パスを備えた新しいコンピューティング パワー ベースの構築に役立つだけでなく、安全かつ効率的にスケジュール、管理、これらの分散された cpu および gpu リソースを接続することにより、インテリジェント コンピューティング センターの効果的なコンピューティング能力が解放されます。したがって、dpu の導入により、データセンターの 1 回限りの capex (資本支出) 投資を削減できます。シスコのデータによると、仮想化テクノロジーにより、企業はリソースの使用率を向上させながらサーバーの数を最大 40% 削減できることが示されています。
一方、dpu は、専用ハードウェアを通じてネットワーク、セキュリティ、ストレージのタスクを高速化することで、データセンターのエネルギー効率を向上させます。
lu sheng 氏は、浙江省における china mobile の sd-wan のアプリケーション シナリオを例に挙げ、「xinqiyuan dpu ネットワーク カードによって作成された統合ソフトウェアおよびハードウェア ソリューションは、ネットワーク セキュリティ サービスのオフロードを実現します。従来の純粋なソフトウェア sd と比較して、 wan ネットワーク ソリューションでは、単一マシンの効率が 6 ~ 8 倍向上し、プロジェクト全体でサーバー導入投資と年間ソフトウェア コストが 80% 節約され、さらにマシン導入によるデータ センターの容量の削減により capex 投資が大幅に削減されました。これによりエネルギー消費が削減され、年間 300 万キロワット時以上の電力が節約されると推定されていると同時に、データセンターの運用コストも大幅に削減されます。」
コストの点では、dpu の研究開発と生産コストは比較的高く、特に高度なプロセスを使用する場合は価格が高くなることがわかりました。しかし、dpu ソリューションの導入により、数を削減できるだけではありません。計算プロセス中にエネルギー消費が節約されるため、システム全体のコストは依然として費用対効果が高くなりますが、特定のシナリオとアプリケーションに基づいて議論する必要もあります。
今後 3 年間は商業化に向けた重要な期間となる
しかし、現在の dpu 普及率の増加は依然として抵抗に直面しています。
ハードテクノロジー分野への初期投資に重点を置くベンチャーキャピタル機関、チャイナ・サイエンス・アンド・テクノロジー・スターの関係者はチャイナ・ビジネス・ニュースに対し、dpuはソフトウェアとハ​​ードウェアのコラボレーションのための仮想化アーキテクチャとして、システムと効果的に接続する必要があると語った。同時に、dpu のハードウェア設計は、既存のシステムとの互換性と統合を考慮する必要があります。第 2 に、dpu のアーキテクチャとインターフェイスはまだ統一された標準を形成しておらず、dpu の製品には相違点があります。メーカーが異なるため、使用、メンテナンス、アップグレードの際にユーザーに課題が生じます。さらに、ソフトウェア エコシステムはまだ成熟しておらず、完全な開発ツール、ドライバー、オペレーティング システムのサポートが不足しています。「しかし、すでにそれを行っている企業があります。」
lu sheng 氏は、dpu には専用の効率的な命令セットが必要であり、これが競争力の中核でもあり、残りの 3 分の 2 は命令セットを中心としたエコシステムの構築が dpu 業界の中核的な障壁であると述べました。エコロジー構造の成熟度が製品の商品化のスピードを決定します。
全体として、dpu 業界は依然として外資系企業によって支配されており、nvidia、broadcom、intel の 3 つの巨人が比較的高いシェアを占めており、amazon や microsoft などのテクノロジー企業もこれに追随しています。国内では、china mobile や alibaba などの大企業も専用 dpu を開発しており、xinqiyuan、zhongke yushu、dayu zhixin などのスタートアップ企業も同様の成果または進歩を遂げています。
「国内外のdpu技術の発展は同じ段階にありますが、外国企業の方がより深い蓄積を持っています。私の意見では、dpu業界は実際に徐々に成熟し、急速な実装の段階に向かっています。外国はより早く、より速く進む可能性があります」国内のものよりも」と張宇氏は語った。
dpuの商用化に関しては、現時点で商用利用を実現しているのはファーウェイ、アリババ、zteなどの国内大手クラウドメーカーと、新奇源、中科玉樹などの少数の新興dpu勢力だけだ。情報通信技術アカデミーは、我が国のデータセンターの dpu 普及率が 2025 年に 12.7% に達すると予測しています。
zhang yu 氏は、dpu の現段階では、iaas レイヤーでのクラウドとの緊密な統合がより重要であると考えています。特に、顧客がスムーズに移行できるように、包括的で便利で透明性のある純粋なソフトウェア iaas ソリューションをどのように提供するかです。 dpu は、このエネルギー効率の高いクラウド ソリューションをサポートします。
「この分野の移行には業界の共同の取り組みが必要であり、数年に及ぶ長期間にわたるものになるだろう。」と zhang yu 氏は語った。「amazon cloud はより速く進んでいます。彼らは強力な研究開発能力を備えており、dpu 上の iaas を完成させています。しかし、ほとんどの国内企業にとって、そのペースはそれほど大きなものではなく、ovs のアンインストールやネットワークのアップグレードなどの最も困難な点から透過的に使用される可能性があります。」
「dpuの商業化は、従来のデータセンターのiaas分野に依存するだけでなく、ネットワークセキュリティ、高性能ストレージ、クラスター通信、その他多くの業界や分野も含まれる」とxinqiyuanは「dpu」に深く関わっているとlu sheng氏は述べた。 dpu は、ファイアウォールやセキュリティ ゲートウェイなどの製品に適用されています。現在、sangfor ネットワーク セキュリティ製品ラインに加わり、標準の拡張カードとなり、intel cpu の不足などの業界の問題を解決しています。エレファントストリーム処理機能。
「現在の業界の発展傾向から判断すると、技術開発が期待通りに進めば、2025年から2027年にかけて爆発的な成長が見込まれる」と前出の中科創興関係者は、その理由はデジタル経済の発展に伴い、aiの発展にあると述べた。この発展に伴い、サーバー市場は、特に金融、政府、パワー ユーザーの分野で成長を遂げるでしょう。これらの市場では、データを処理してコンピューティング効率を向上させるために多数の dpu が必要になるだけでなく、dpu も必要になります。セキュリティを活用するために。
「dpu チップは確かに大規模に使用されており、現在の成長率は年間 20% ~ 30% です。ただし、dpu の業界の特徴として安定性を維持する必要があり、クラスター上で安定して実行する必要があります。クラスターを拡大するまでに数ヶ月かかる」と張裕氏は述べ、さらに重要なことは、国内の情報およびイノベーション産業の発展を踏まえると、この2、3年は非常に重要な時期であり、すべての目標を達成するための重要な時間枠であるということだ。 dpu メーカーは把握する必要があります。
「dpuはまだ標準化された製品ではありません。商品化と量拡大のプロセスには、市場の需要とさまざまなアプリケーションシナリオに基づいた徹底的な磨きが必要です。それには、数百の小規模なパイロットプロジェクトから、上流と下流のメーカーの協力が必要です」 「小さな一歩を踏み出すことで、何千マイルもの距離を達成できるのです。」と lu sheng 氏は述べました。 3u 一体型国産 cpu+gpu+dpu の商品化への道を共に歩んでまいります。
(この記事は中国ビジネスニュースからのものです)
レポート/フィードバック