ニュース

スマート コンピューティング センター チップを計画しているのは誰ですか?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

本文: 半導体産業の視点

最近では「コンピューティングパワー」関連産業の活況が続いており、インテリジェントコンピューティングセンターの建設も各地で盛んになっている。

2024年に入り、武昌インテリジェントコンピューティングセンター、チャイナモバイルインテリジェントコンピューティングセンター(青島)、華南データバレーインテリジェントコンピューティングセンター、鄭州人工知能コンピューティングセンター、ブロードデータ深セン前海インテリジェントコンピューティングセンターなどが建設を開始または稼働開始している。

不完全な統計によると、現在全国で30以上の都市がインテリジェントコンピューティングセンターを建設中、または建設を提案しており、その投資規模は100億元を超えている。

インテリジェント コンピューティング センターとは正確には何ですか?インテリジェントコンピューティングセンターは主に何に使用されますか?インテリジェントコンピューティングセンターの特徴は何ですか?

インテリジェント コンピューティング センターとは何ですか?

「コンピューティングインフラストラクチャの質の高い発展のための行動計画」の定義によると、インテリジェントコンピューティングセンターとは、一般的なコンピューティング能力(CPU)とインテリジェントなコンピューティング能力(GPU、FPGA、 ASIC など)、主に人工知能アプリケーション (人工知能深層学習モデル開発、モデル トレーニング、モデル推論、その他のシナリオ) に必要な計算能力、データ、アルゴリズムを提供する施設。

インテリジェント コンピューティング センターは、人工知能コンピューティング タスクに焦点を当てたデータ センターであるとも言えます。

データ センターには、通常、インテリジェント コンピューティング センターに加えて、一般的なコンピューティング タスクに焦点を当てた一般コンピューティング センターと、スーパーコンピューティング タスクに焦点を当てたスーパーコンピューティング センターの 3 つのカテゴリがあります。


2023 年は、AIGC テクノロジーが画期的な進歩を遂げ、インテリジェントなコンピューティング能力のキャリアとして、新しいビジネスが急速に台頭しています。コンピュータ室から一般のコンピュータセンターまで発展し、現在のスーパーコンピュータセンターとインテリジェントコンピュータセンターに発展しました。

インテリジェント コンピューティング センターと一般的なデータ センターの違いは何ですか?

インテリジェント コンピューティング センターは通常、クラウド コンピューティングと密接に関連しており、リソース制御とインフラストラクチャ管理の柔軟性を重視しています。クラウド環境では、データ センター プロバイダーがハードウェアと特定のソフトウェア ツールのメンテナンスを担当し、顧客がデータを所有します。対照的に、従来のローカル データ センターでは、企業がすべてのデータ リソースを自社で管理および維持する必要があります。

本質的な違いは、資本投資、リソースの導入、セキュリティの点で 2 つのモデル間の大きな違いにつながります。

資本投資の面では、インテリジェント コンピューティング センターの顧客は、ハードウェアやソフトウェアに多額のコストを費やすことなく、パブリック クラウド、プライベート クラウド、ハイブリッド クラウドなど、自分に合ったサービス モデルを選択できます。一方、従来のデータ センターの顧客は多額の投資が必要です。必要なサーバー、ネットワーク、ストレージ機器を購入および維持します。

リソースの展開とセキュリティの観点から、インテリジェント コンピューティング センターの顧客は、インターネットを通じていつでもどこでもデータとアプリケーションにリモート アクセスして管理できます。同時に、データ センター プロバイダーが提供する専門的なセキュリティ保証も享受できます。ファイアウォール、暗号化、バックアップとリカバリなど。一方、従来のデータセンターの顧客はオフィス/指定された場所によって制限されており、データを自分で保護および管理する必要があります。

インテリジェント コンピューティング センターは、単に人工知能に特化したデータ コンピューティング センターであり、人工知能の計算に必要な専用のコンピューティング パワーを提供できます。従来のデータセンターと比較して、インテリジェント コンピューティング センターは、よりターゲットを絞ったニーズに対応し、より大きなコンピューティング量とより高速なコンピューティング速度を備え、大規模モデルのトレーニング推論、自動運転、AIGC フォースなどのさまざまな垂直産業シナリオに AI コンピューティングを提供できます。

AI インテリジェント コンピューティングにはどのようなチップが必要ですか?

ハードウェアの選択に関して、インテリジェント コンピューティング センターのハードウェア アーキテクチャも従来のデータ センターとは異なります。

AI インテリジェント コンピューティングにはどのようなコンピューティング チップが必要ですか?

従来のデータセンターのハードウェア アーキテクチャは比較的シンプルで、主にサーバー、ストレージ デバイス、ネットワーク デバイスが含まれています。このハードウェア アーキテクチャと比較して、インテリジェント コンピューティング センターはより柔軟になり、さまざまなアプリケーション シナリオに応じてさまざまなコンピューティング ノードが選択されます。

インテリジェント コンピューティング サーバーは、インテリジェント コンピューティング センターの主要なコンピューティング ハードウェアであり、通常、「CPU + GPU」、「CPU + NPU」、または「CPU + TPU」のヘテロジニアス コンピューティング アーキテクチャを採用し、パフォーマンス、コスト、および性能を最大限に発揮します。さまざまなコンピューティング チップのパフォーマンスを向上させ、エネルギー消費における利点を実現します。

GPU、NPU、TPUはコア数が多く、並列計算を得意としています。 AI アルゴリズムには多数の単純な行列演算タスクが含まれており、強力な並列コンピューティング機能が必要です。

従来の汎用サーバーは、クラウド コンピューティングやエッジ コンピューティングなどの基本的な汎用コンピューティングをサポートするメイン チップとして CPU を使用します。

AI インテリジェント コンピューティングにはどのようなメモリ チップが必要ですか?

コンピューティング パワー チップが異なるだけでなく、AI インテリジェント コンピューティングではメモリ チップに対する要件も高くなります。

1つ目は投与量です。インテリジェント コンピューティング サーバーの DRAM 容量は通常、通常のサーバーの 8 倍、NAND 容量は通常のサーバーの 3 倍です。その PCB 回路基板にも、従来のサーバーよりもはるかに多くの層があります。

これは、インテリジェント コンピューティング サーバーが必要なパフォーマンスを達成するには、より多くのメモリ チップを導入する必要があることも意味します。

需要が増加するにつれて、一連のボトルネックの問題も表面化します。

一方では、従来のノイマン型アーキテクチャではデータをメモリにロードする必要があるため、データ処理効率が低く、待ち時間が長く、消費電力が高くなります。他方では、メモリの壁の問題によりプロセッサのパフォーマンスが大幅に向上します。その結果、SSD とメモリの間で大量のデータを転送する必要があり、さらに CPU に搭載されている SSD の容量と帯域幅の制限もパフォーマンスのボトルネックになっています。

「ストレージの壁」や「消費電力の壁」などの問題に直面しているため、従来のコンピューティング アーキテクチャにおけるコンピューティング ストレージ アーキテクチャは、ストレージとコンピューティングを有機的に統合することによってのみ、インテリジェント コンピューティング時代の膨大なデータに匹敵するものとなり、早急にアップグレードする必要があります。データストレージ要件には大きなエネルギー効率の向上の可能性があります。

この一連の問題に対しては、統合されたストレージと計算チップが良い解決策となる可能性があります。

さまざまなチップに加えて、パフォーマンスを最大限に発揮し、安定した動作を確保するために、AI サーバーもアーキテクチャ、放熱、トポロジなどの側面が強化されて設計されています。

誰がこれらのチップを配置しているのでしょうか?

コンピューティングパワーチップのレイアウト

GPU 側では、GPU は大規模な並列コンピューティングを得意としています。 Huawei、Tianshu Zhixin、Moore Thread、Sugon、Suyuan Technology、Nvidia、Intel、AMDなどが関連チップを発売している。たとえば、ファーウェイは、Ascend シリーズの AI チップ、Ascend 910 および Ascend 310 を発売しました。これらのチップは、AI のトレーニングと推論用に特別に設計されており、高性能と低消費電力が特徴です。 Ascend シリーズは、データセンター、クラウド サービス、エッジ コンピューティングなどの分野で広く使用されており、インテリジェント コンピューティング センターに強力なコンピューティング能力をサポートします。

NVIDIA は、A100、H100 など、AI トレーニングと推論用の多数の GPU 製品を発売しました。 Intelはまた、Nvidiaとの競争を目指して、Habana LabsのGaudiシリーズのチップなど、多数のAIチップ製品を発売している。 AMDはAIチップの分野でも計画を立て、MIシリーズのGPUおよびAPU製品を発売した。

FPGA に関しては、CPU+FPGA は柔軟性と高性能を兼ね備え、アルゴリズムの急速な変化に適応します。市場の主要なプレーヤーはザイリンクスとインテルです。関連製品には、ザイリンクスの VIRTEX、KINTEX、ARTIX、SPARTAN 製品シリーズ、およびインテルの Agilex 製品シリーズが含まれます。

ASIC に関しては、CPU+ASIC は特定のニーズに合わせて高性能のカスタマイズされたコンピューティングを提供します。 Google、Intel、NVIDIAなどの海外大手企業が相次いでASICチップをリリースした。 Cambrian、Huawei HiSilicon、Horizo​​n などの国内メーカーも、ディープ ニューラル ネットワークによって加速される ASIC チップを発売しています。

NPU に関して言えば、NPU は人工知能と機械学習のシナリオ向けに特別に設計されたプロセッサです。 CPU や GPU とは異なり、NPU はハードウェア構造が特に最適化されており、ニューラル ネットワーク推論などの AI 関連のコンピューティング タスクの実行に重点を置いています。 CPU の汎用性と NPU の特異性を組み合わせることで、システム全体がさまざまな AI アプリケーション シナリオに柔軟に対応し、アルゴリズムやモデルの変更に迅速に適応できるようになります。

現在、市場には多くの量産 NPU または NPU モジュールを搭載したチップがあり、よく知られているものには、Qualcomm Hexagon NPU や Huawei の Ascend シリーズなどがあります。注目に値するのは、すべての主要メーカーがチップ コンピューティング コアの設計に独自の設計を採用していることです。 。 戦略。

TPU に関して言えば、TPU はディープ ニューラル ネットワークのコンピューティング能力を高速化するために Google によって開発されたチップであり、大規模なディープ ラーニング タスクの処理に重点を置いており、より高いコンピューティング能力とより低いレイテンシーを備えています。 TPU も ASIC チップです。

DPU に関しては、DPU はデータ処理タスク用に特別に設計されており、特定の分野のコンピューティング ニーズに適した高度に最適化されたハードウェア構造を備えています。一般的なコンピューティングに使用される CPU やアクセラレーション コンピューティングに使用される GPU とは異なり、DPU はデータセンターの 3 番目のメイン チップです。 NVIDIA、Broadcom、Intel という国際的な大手 3 社の DPU 製品が国内市場の大部分を占めており、Xilinx、Marvell、Pensando、Fungible、Amazon、Microsoft などの多くのメーカーも、過去に DPU または同様のアーキテクチャ製品を製造しています。 5年。 。国内メーカーには、Zhongke Yushu、Xinqiyuan、Yunbao Intelligence、Dayu Zhixin、Alibaba Cloudなどが含まれます。

国産のコンピューティングチップはどこへ行ったのでしょうか?

2024年の北京モバイルコンピューティングネットワーク会議で、中国モバイルコンピューティングセンターの北京ノードが正式に使用開始され、我が国のインテリジェントコンピューティングセンターの建設における新たな段階が始まりました。北京初の大規模なトレーニングとプロモーションの統合インテリジェント コンピューティング センターとして、このプロジェクトは約 57,000 平方メートルの面積をカバーし、約 4,000 枚の AI アクセラレータ カードを展開し、AI チップのローカライズ率は 33% で、インテリジェント コンピューティング センターを備えています。パワースケールは1,000P以上。

北京スーパークラウドコンピューティングセンターの運営主体である北京北龍スーパークラウドコンピューティング有限公司の最高技術責任者(CTO)であるジェン・イェナン氏は最近、現在国内の大型モデルに国産チップを「移植」しており、所要時間はわずか15日程度だと述べた。駆け抜けるために。彼は、コンピューティング能力の共有が業界の主要なトレンドになると信じており、ハイエンド GPU コンピューティング リソースにはすべての関係者の努力が必要です。

近年、中国の人工知能コンピューティングパワーチップの市場構造は主にNVIDIAが独占しており、市場シェアの80%以上を占めています。

Zhen Yanan氏は、「我々は国産チップの開発にも非常に懸念している。国内で自社開発した大型モデルや一部のオープンソースの大型モデルさえも継続的に国産チップに移植されていることが理解されている。現在、チップの使用の観点から見ると、一部の製品は国産チップに移植されている」と述べた。搭載されているモデルは実行できますが、追いつく必要があるのは主に GPU などの高性能です。」

「ローカリゼーション全体は階層的です。チップはハードウェア層に属します。さらに、ソフトウェアエコシステムもあります。国産チップの場合、フレームワークとエコシステムの両方に一定の育成サイクルが必要です。」と Zhen Yanan 氏は最終アプリケーション側に要求しました。国産チップには十分な自信があります。

メモリチップのレイアウト

インテリジェント コンピューティング センターには、ストレージに関して大容量、高信頼性、高可用性などの特性が必要です。ストレージ デバイスは通常、高性能ハード ドライブまたはソリッド ステート ドライブを使用し、データのセキュリティとアクセス性を確保するために冗長ストレージ アーキテクチャを備えています。 Samsung、Micron、SK Hynix などは、データセンター、クラウド コンピューティング、その他の分野で広く使用されている関連チップを備えており、インテリジェント コンピューティング センター向けの高性能ストレージ ソリューションを提供しています。

近年、国内メーカーもDRAMやNAND技術をキャッチアップして急速な発展を遂げています。

インテリジェント コンピューティング センターには、従来のメモリ チップに加えて、より大きな役割を果たすために、前述の新しいストレージ - ストレージ - コンピューティング統合チップも必要です。

統合ストレージとコンピューティングの開発の歴史から判断すると、2017 年以降、NVIDIA、Microsoft、Samsung などの大手メーカーが統合ストレージとコンピューティングのプロトタイプを提案し、同年に国内の統合ストレージとコンピューティング チップ企業が出現し始めました。

ストレージとコンピューティングの統合アーキテクチャに対する大手メーカーの要求は、実用的かつ迅速に実装できるものであり、エンジニアリング実装に最も近いテクノロジーとして、ニアメモリ コンピューティングが大手メーカーの第一の選択肢となっています。 Tesla や Samsung などの豊富なエコシステムを持つ大手メーカーだけでなく、Intel や IBM などの従来のチップ メーカーも、ニアメモリ コンピューティングを導入しています。

国内のスタートアップ企業は高度なプロセス技術を必要としないインメモリコンピューティングに注力している。その中で、Zhicun Technology、Yizhu Technology、Juiutian Ruixinなどの新興企業はいずれも、PIMやCIMなど、ストレージとコンピューティングを「ストレージ」と「コンピューティング」をより密接に統合するテクノロジー路線に賭けている。 Yizhu Technology、Qianxin Technology などは大規模モデル計算や自動運転などの AI の大規模コンピューティング能力シナリオに焦点を当てており、Shanyi、Xinyi Technology、Pingxin Technology、Zhicun Technology などはモノのインターネット、ウェアラブル デバイス、スマート ホームに焦点を当てています。限界コンピューティング能力などのシナリオ。

Yizhu Technology は、統合されたストレージおよびコンピューティング アーキテクチャを使用した AI 高出力チップの設計に取り組んでおり、完全なデジタル チップ設計アイデアを通じて、memristor ReRAM を初めて統合されたストレージおよびコンピューティング アーキテクチャと組み合わせて、より優れたソリューションを提供します。現在の産業構造に伴い、コスト効率が高く、エネルギー効率が高く、演算能力の開発余地が大きいAI大型演算パワーチップの開発が新たな方向に進んでいます。

Qianxin Technology は、人工知能および科学技術コンピューティング分野向けの大規模コンピューティング パワー ストレージおよびコンピューティング統合コンピューティング チップおよびコンピューティング ソリューションの研究開発に重点を置いており、2019 年に初めて再構成可能なストレージとコンピューティングの統合テクノロジー製品アーキテクチャを提案しました。計算スループットの点で他社と比較 従来の AI チップはパフォーマンスを 10 ~ 40 倍向上させることができます。現在、Qianxin Technology の再構成可能なストレージとコンピューティングの統合チップ (プロトタイプ) は、クラウド コンピューティング、自動運転認識、画像分類、ナンバー プレート認識などの分野で試行または実装されており、大規模なコンピューティング パワー ストレージとコンピューティングの統合チップ製品のプロトタイプも開発されています。中国で初めて大手インターネット企業の内部テストに合格しました。

Zhicun Technology の計画は、メモリを再設計し、フラッシュ メモリ ストレージ セルの物理的特性を利用し、より多くのデータを収容できるようにストレージ アレイを変換し、周辺回路を再設計することです。同時に演算子をメモリに格納することで、それぞれの各ユニットはシミュレーション演算を実行し、演算結果を直接出力することで、記憶と計算を統合するという目的を達成できます。

インテリジェントコンピューティングが規模の30%以上を占め、コンピューティングパワーの構築が本格化

7月上旬、天府インテリジェンス南西コンピューティングセンターが四川省成都市で正式に稼働を開始した。報告書によると、このセンターはコンピューティング能力を活用して成都の1000億レベルの人工知能中核産業の創設を支援し、工業製造、自然科学、生物医学、科学研究のシミュレーション実験などの分野で人工知能のイノベーションを推進するという。

これは特別なケースではありません。先月、銀川グリーン インテリジェント コンピューティング センター プロジェクトが集中的に開始されました。北京モバイルは、数百億、数千億の大規模モデルのトレーニングと推論をサポートする、北京初の大規模なトレーニングとプロモーションを統合したインテリジェント コンピューティング センターを構築しました。高度な複雑性と高度なコンピューティング要件; 鄭州 人工知能コンピューティング センターの建設が開始され、総投資額は 16 億元を超えます... インテリジェント コンピューティング センターに代表される新しいデジタル インフラストラクチャは、その構築と実装を加速しています。

7月15日に国家統計局が発表したデータによると、5月末の時点で全国に46万基の5G基地局が建設され、高性能コンピュータークラスターを備えたインテリジェントコンピューティングセンターが10カ所以上建設される予定で、インテリジェントなコンピューティング能力も備えている。 % は総コンピューティング能力の 30% 以上を占めています。

China IDC Circle の不完全な統計によると、2024 年 5 月 23 日の時点で、中国本土には 283 のインテリジェント コンピューティング センターがあり、中国本土のすべての省、自治区、直轄市をカバーしています。その中で、投資統計のあるインテリジェントコンピューティングセンタープロジェクトは140件あり、総投資額は4364億3400万元である。計算能力規模の統計が計画されているインテリジェント コンピューティング センター プロジェクトは 177 件あり、合計の計算能力規模は 369,300 PFlops に達します。

これらの「インテリジェント コンピューティング センター」にはさまざまな基準と規模がありますが、コンピューティング能力の規模は一般的に 50P、100P、500P、1000P に達し、中には 12000P 以上に達するものもありますが、AI の波はインテリジェント コンピューティング センターに幅広い発展の見通しをもたらしています。需要と供給の不一致、高価格、建設の重複は依然として我が国のコンピューティングパワー建設が直面している問題です。

同時に、今後数年間の建設目標を明確にし、技術、申請、資金面での支援策を充実させるための特別計画も多くのところで導入されている。たとえば、江蘇省は、省のコンピューティング能力インフラストラクチャの開発に関する特別計画を発表し、2030 年までに同省で使用される総コンピューティング能力が 50EFLOPS (EFLOPS は 1 秒あたり 100 億回の浮動小数点演算を指します) を超えることを提案しています。甘粛省は、土地利用、地方自治体の支援施設の建設、人材の導入、資金調達の面で、新しいコンピューティングネットワークインフラストラクチャに政策支援を提供することを提案している。

「人工知能の大型モデルなどのアプリケーションの爆発的な発展により、インテリジェント・コンピューティング能力に対する需要が急増している。」と国家情報センター情報化・産業開発局のディレクターであるシャン・ジグアン氏は、インテリジェント・コンピューティングは急速に発展していると述べた。その中で、大型モデルはインテリジェント コンピューティング能力の最大の需要者であり、需要のほぼ 60% を占めています。 2027 年までに、中国のインテリジェント コンピューティング能力の年間複合成長率は 33.9% に達すると予想されています。