Yizhu Technology 会長 Xiong Dapeng との対話: ストレージとコンピューティングの統合により、AI 時代のコンピューティング能力の第 2 の成長曲線が始まる可能性がある
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
人工知能 (AI) の爆発的な発展により、コンピューティング能力に対する膨大な需要がもたらされ、ポスト ムーアの時代では、高度なチップ製造プロセスは物理的な限界に近づき、ストレージとコンピューティングの統合が重要なテクノロジー ルートの 1 つになると予想されています。将来。
ストレージとコンピューティングは統合されています。つまり、データ ストレージとコンピューティングが同じチップの同じ領域に統合されています。統合ストレージおよびコンピューティング アーキテクチャ チップのパフォーマンスとコストの利点はどのような側面に反映されていますか?大規模な商業化が直面している現在の課題は何ですか?ストレージとコンピューティングの統合により、国内のチップ産業が方向転換して追い越す可能性はあるだろうか?
China Business News は最近、Yizhu Technology の創設者、会長兼 CEO である Xiong Dapeng 氏と上記のテーマについて意見交換しました。同氏の見解では、ストレージとコンピューティングの統合テクノロジーには将来のコンピューティング分野に変革の可能性があり、ムーアの法則を打ち破り、コンピューティング能力の第2の成長曲線が始まるだろう。 「特に AI 時代において、このテクノロジーはコンピューティング能力の成長を促進する重要な要素になる可能性があります。」
ノイマン型アーキテクチャを打ち破り、3 つの主要な問題を解消する
従来のノイマン型アーキテクチャでは、コンピューティング機能とストレージ機能はそれぞれコンピューティング ユニット (CPU、GPU など、XPU) とストレージ ユニットによって実現されます。データはメモリから取得され、処理後にメモリに戻されます。処理装置の外部にデータを転送してメモリから読み出すのに必要な時間は、多くの場合、計算時間の数倍となり、計算効率または実効的な計算能力が低下します。
「大規模なモデルが普及している今日では、計算を完了するためにモデル パラメーターを移動する必要があります。パラメーターの量は非常に多く、費やされる時間は高い割合 (80% 以上) を占めます。場合によっては、これがしたがって、データ帯域幅によって実際のチップのパフォーマンスが制限される可能性がありますが、実際のパフォーマンスはこの数値よりもはるかに低い可能性があります。」と Xiong Dapeng 氏は言います。チャイナ・ビジネス・ニュースに語った。
「ストレージウォール問題」に加えて、送信過程で大量のエネルギーが消費され、チップのエネルギー効率が大幅に低下する「エネルギーウォール問題」が発生する。
さらに、「コンパイルの壁」の問題があります。つまり、動的なデータ フローのスケジューリングは複雑であり、コンパイラーは、静的で予測可能な条件下でデータ フローの最適化を達成するために演算子と実行可能プログラムを自動的に最適化することができず、手動に頼る必要があります。これを実現するための調整は、効率的なコンピューティング能力が高いほど、実際の導入と移行にかかる時間と人件費が増加します。 Xiong Dapeng氏は、「これら3つの点がAI産業の発展を大きく制限しており、リソースがますます不足しており、電力消費が大幅に増加している」と述べた。
統合ストレージおよびコンピューティング技術は、フォン・ノイマン・アーキテクチャを打ち破り、ストレージ機能とコンピューティング機能を同一チップ上に統合し、「読み取り」回路のインメモリ・コンピューティング・アーキテクチャを変更することで、ストレージ・ユニットをデータ処理に直接使用することができます。 「読み取り」回路では、「演算結果は回路内で取得され、その結果はメモリの宛先アドレスに直接「書き戻され」ます。演算ユニットと記憶ユニットの間の頻繁なデータ転送は不要になり、不要になります。データの移動による消費電力を削減し、コストを大幅に削減し、コンピューティング効率を大幅に向上させます。
「ストレージとコンピューティングの統合テクノロジーは、ポストムーア時代の重要な技術ルートの 1 つになると予想されます。効果的なコンピューティング能力の第一原則から、ストレージとコンピューティングの統合では、データ転送量が大幅に削減され、効率的なコンピューティング能力が実現されます。」コンピューティング能力は直線的な成長を示しています。 ストレージとコンピューティング能力は統合されていると言えます。 コンピューティング統合はムーアの法則を打ち破り、コンピューティング能力の第 2 の成長曲線を切り開くものであると同時に、ストレージとコンピューティング能力の統合テクノロジーが変革をもたらすと考えています。将来のコンピューティング分野、特にAI時代においてこの技術はコンピューティング能力の成長を促進する重要な要素となる可能性がある」とXiong Dapeng氏は語った。
エネルギー効率とコストパフォーマンスに優れたソリューション
最近人気の高帯域幅メモリ チップ HBM と比較して、ストレージとコンピューティングの統合アーキテクチャ チップは、システムのエネルギー効率とコスト パフォーマンスが優れています。
HBM は、主に GPU およびハイ パフォーマンス コンピューティング (HPC) システムのデータ処理能力を向上させるために使用されるハイ パフォーマンス メモリ インターフェイス テクノロジです。このテクノロジーは、DRAM チップを垂直に積層し、高速相互接続を使用してプロセッサに緊密に接続することにより、帯域幅を劇的に増加させます。
「HBMは『ストレージウォール』問題を解決する効果的な技術的手段ですが、コストと消費電力が必要です。なぜなら、大きな帯域幅を提供するにはより多くの電力消費が必要であり、価格も非常に高価で、従来のDRAMの価格をはるかに超えているからです。」 Xiong Dapeng氏は、「本質的に、HBMはメモリチップであり、コンピューティング機能を持たない。コンピューティング機能を実現するには、GPGPUなどのコンピューティングチップと組み合わせる必要がある」と述べた。
システムコストの観点から見ると、統合されたストレージとコンピューティングチップは、従来の GPGPU と HBM の組み合わせよりも低くなる可能性があります。
一方で、これは、統合されたストレージとコンピューティング アーキテクチャのコンピューティング能力密度 (PPA) が高いためです。 「統合されたストレージとコンピューティング アーキテクチャの同等のデータ帯域幅は、HBM の帯域幅よりもはるかに大きく、その差は数倍、場合によっては 10 倍になる可能性があります。同時に、その計算能力密度はさらに有利です。実際の有効な計算能力、コストパフォーマンス、エネルギー効率比は GPGPU+HBM ソリューションよりもはるかに高くなります」と Xiong Dapeng 氏は述べています。
一方、統合ストレージおよびコンピューティング テクノロジーは高度なプロセスへの依存度が比較的低いのに対し、GPGPU と HBM は両方とも高度なプロセスに大きく依存しています。 「HBMは高度なプロセスに依存しており、サプライチェーンに大きなリスクを抱えています。しかし、ストレージとコンピューティングの統合テクノロジー路線を採用すれば、12nmや22nmなどの高度なプロセスを使用しなくても、パフォーマンスは4nmや4nmよりも劣ることはないかもしれません」 3nmでもこれは追い越しの概念です。」
コストパフォーマンスの点では、ストレージとコンピューティングを統合すると、同じパフォーマンスを達成するためにより多くのチップが必要になる可能性がありますが、その高いコストパフォーマンスと高いエネルギー効率が大きな利点の1つです。
今後2~3年以内に大型モデルの分野で大規模に導入される可能性がある。
統合されたストレージとコンピューティング技術の研究と応用が世界中で加速しています。
現在、ストレージとコンピューティングの統合路線を採用している海外の大規模コンピューティングチップ企業には、時価総額28億ドル以上でNvidiaの強力な競争相手とみなされているAIチップ新興企業Groqが含まれる。マイクロソフト、テマセク、サムスン、マーベル、海南などを買収。ラックス、エリクソン、その他多くの企業が投資しています。
さらに、Samsung は、MRAM ベースのインメモリ コンピューティングに関する研究を Nature 誌に発表し、AI アルゴリズムの高精度を実証しました。 SK Hynix は、コンピューティング速度を大幅に向上させ、消費電力を削減できる GDDR インターフェイスに基づく DRAM インメモリ コンピューティング製品を発売しました。
「私の知る限り、ほとんどの海外企業は SRAM に基づいてストレージとコンピューティングの統合を実装していますが、その容量は低く、コストは高くなります。たとえば、Groq の完全なソリューションには 570 以上のチップが必要です。NVIDIA H100 を使用する場合、チップの数は一桁にすぎず、これは主にストレージ密度の不足が原因であると、Xiong Dapeng 氏は、多くの国内の新興企業が統合ストレージとコンピューティング技術で画期的な進歩を遂げており、中国のチップ産業が方向転換して追い越す可能性があると述べた。
しかし、統合されたストレージとコンピューティングチップの計算能力が大規模に拡張されると、依然として多くの課題に直面します。第 1 に、信頼性の低い精度の問題です。第 2 に、アナログ計算に基づいて、デジタルからアナログへの変換がエネルギーのボトルネックを引き起こします。第三に、大規模な AI モデルには容量の要件があります。
「完全なデジタル化により、これらの問題はうまく解決できます。これは、Yizhu Technology が AI の大型計算能力推論チップを開発するための基礎でもあります。」
一般的なアナログストレージとコンピューティングの統合システムでは、データはストレージユニット内のさまざまな電圧レベルで表されるアナログ信号の形式で保存され、MAC などの演算はオームの法則とキルヒホッフの法則に基づいて実行されます。このアプローチの最大の問題は、アナログ回路のノイズやさまざまな変数のせいで、精度や精度が信頼できないことです。製造プロセスや作業環境に関係なく、メモリスタが表す値には誤差やドリフトが生じます。デジタルとアナログのハイブリッド方式は、効率と精度の問題のバランスをとろうとしますが、それでも高い精度と精度の信頼性を保証することはできません。
Xiong Dapeng 氏は、Yizhu Technology のソリューションは、memristor (ReRAM) に基づいた完全なデジタル ストレージとコンピューティングの統合であると紹介しました。完全にデジタルであるため、メモリスタは 1 ビットのみを表し、高抵抗と低抵抗、高電流と低電流の違いのみが存在します。それは信頼できるでしょう。
さらに、統合ストレージとコンピューティングの開発は、プロジェクトの実装上の問題にも直面しています。 「新しいテクノロジーのルートとして、既存のエコロジーをどのように利用し統合するかが大きな課題です。プログラム可能性と既存のエコロジーとの互換性が重要です。」と Xiong Dapeng 氏は China Business News に語った。
総合すると、ストレージとコンピューティングの統合テクノロジーは、高いコンピューティング能力需要と高いエネルギー消費コストの間の矛盾を解決する効果的な手段であると世界的に見なされており、これは中国のチップ産業にとって追いつく重要な機会でもあります。今後数年間、テクノロジーが成熟し続け、市場の需要が増加するにつれて、統合されたストレージおよびコンピューティングチップが多くの分野で広く使用され、業界全体の革新的な発展を促進すると予想されます。現時点では、大型モデルの分野における統合ストレージおよびコンピューティングチップの適用はまだ開発段階にあり、Xiong Dapeng 氏は、今後 2 ~ 3 年以内に大規模に実装されると予測しています。
(この記事は中国ビジネスニュースからのものです)