ニュース

インテル幹部: AI モデルは徐々にクラウドからエッジに移行する

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

・クラウドの処理時間は長くなり、データ通信コストは高くなり、データのセキュリティにも懸念が生じます。 Intelの上級副社長サチン・カッティ氏は、AIはエッジまで浸透しており、大型モデルは徐々にクラウドからエッジに移行する可能性があると述べた。


インテルのネットワーキングおよびエッジ グループ担当シニア バイスプレジデント兼ゼネラル マネージャーである Sachin Katti 氏は次のように述べています。

「ローカル データを処理するために、AI がよりエッジで展開および適用されると予想されます。時間が経つにつれて、AI モデルは徐々にクラウドからエッジに移行する可能性があります。」 7 月 24 日、インテル ネットワーク & エッジ 2024 コンピューティング産業カンファレンスにて、サチン氏。インテルのネットワークおよびエッジ部門の上級副社長兼ゼネラルマネージャーであるカッティ氏は、現在の AI は主にクラウドで実行されており、エッジデバイスは大量のデータをローカルで生成するため、すべてのデータをクラウドに送信するコストは非常に高くなっていると述べています。エッジ コンピューティングへの移行が一般的な傾向です。

データ セキュリティとリアルタイムのクラウドからエッジまでの AI の推進

サチン・カッティ氏は、人間はAI支援の時代を迎えており、AI支援の時代が終わると、人間はAIアシスタントの時代に入るだろうと述べた。企業のワークフローも AI で完了できるようになります。遠い将来、人間が連携して部門レベルのソリューションを提供するのと同じように、エージェント同士が対話できるようになるかもしれません。」

サチン・カッティ氏は、今日の AI の成長は主にクラウドに集中しているが、エッジ コンピューティングへの進化が一般的な傾向であると述べ、「以前は、私たちが話していた AI は基本的にマシン ビジョンまたは時系列ベースの自動化テクノロジに関するものでした。しかし現在、エッジ AI は、エッジのマシン ビジョンから大規模言語モデルや生成 AI などのエッジ アプリケーションへと徐々に進歩しています。インテルは、エッジでの生成 AI や大規模言語モデルの展開を加速するための関連機能を提供し続けます。」

クラウドからエッジへの AI の推進においては、エッジ データの送信要件に加えて、データ セキュリティとリアルタイム パフォーマンスも重要な考慮事項となります。インテル マーケティング グループ副社長兼インテル中国ネットワークおよびエッジおよびチャネル データセンター部門のゼネラル マネージャーである Guo Wei 氏は、企業はデータをクラウドに配置することに懸念を抱いている一方で、エッジ コンピューティングはその問題を解決するのに役立つと述べました。リアルタイム要件。

「基本的に、今年の当社の顧客の半数以上は、大規模なエッジ モデルに基づく実装ソリューションを模索しています。」とインテル副社長兼ネットワークおよびエッジ部門中国本部長のチェン・ウェイ氏は、エッジ コンピューティングの実装の観点から次のように述べています。モデルのサイズは大きければ大きいほど良いというわけではありませんが、市場のアプリケーション シナリオの実際のニーズに適合する必要があります。「エッジ コンピューティングの導入では、遅延、可用性、マイクロデータの調整可能な最適化、情報セキュリティなどの多くの要素を考慮する必要があります。 、など。」

エッジチューニングはデータ量によって制限されます

「エッジの特徴は断片化です。」インテル中国のネットワークおよびエッジ部門の最高技術責任者であり、インテルのシニアチーフ AI エンジニアである Zhang Yu 氏は、ユーザーごとにコンピューティング能力とパフォーマンスに対する要件が異なると述べました。エッジ チューニングにおける一般的な課題は、データ量の制限です。学校や工場が実際にトレーニングに使用できるデータの量は非常に少ないです。企業や学校ごとにデータも異なります。自動車部品生産工場や機械加工工場では、統一されたモデルでは製品の欠陥を検出できず、企業固有のデータを使用してモデルをトレーニングする必要があります。

同時に、Zhang Yu氏は、「トレーニングでは、自分が何に注意を払っているかを機械に知らせるためのラベル付けが必要です。工場でAI機能機器を実際に操作するのは、多くの場合、生産ラインの作業員です。どうすればできるでしょうか」と述べました。彼らは生産プロセス中にラベルを付けるエネルギーを持っていますか?」? したがって、データ量が少ない場合にアノテーションを完了するには、エッジ調整中に自動アノテーション方法を使用する必要があります。 「エッジでは、エンドユーザーは技術的なソリューションではなく、ビジネスの導入を追求しています。サービスに対するユーザーの要件は、利便性、導入の容易さ、導入後の管理の容易さです。これは多くの場合、顧客にとって悩みの種です。」

Guo Wei 氏は、実際の業界の問題を解決するにはモデルのトレーニングだけに頼るだけでは十分ではなく、今年は推論能力の向上に対する需要が特に顕著であると述べました。大規模モデルの実装には、エンドからエッジ、そしてクラウドへのコンピューティング能力のバランスのとれた分散が必然的に伴います。「垂直型大規模モデルの単なる標準アプリケーションである場合、大規模モデルは主にクラウドにデプロイされます。しかし、業界での実装の必要性により、AI のコンピューティング能力は必然的にクラウドに移行することになります。「エッジとエンドサイドの分散」。

Sachin Katti 氏は、エッジの主なワークロードは推論と継続学習であると述べました。場合によっては、エッジでのデプロイ後に効果が期待ほど良くないことが判明したり、一定期間実行すると元のモデルを微調整する必要があることが判明します。

エッジではどれくらいのコンピューティング能力が必要ですか? Sachin Katti 氏は、コンピューティング能力とエネルギー消費の間には正の相関関係があると述べました。エッジに導入された機器は約 200 ワットのエネルギーを消費し、クラウド導入では 1 ~ 2 キロワットが消費され、データセンターの単層ラックのエネルギー消費は 100 キロワットに達する場合があります。データセンター全体のエネルギー消費量を合計すると、50~100ギガワットに達する可能性があります。コンピューティング能力またはエネルギー消費が高い場合、冷却効率と冷却能力は考慮する必要がある重要な変数です。大規模なデータと計算能力は大量の熱を発生するため、「現在、フリートを効果的に冷却するために液体冷却技術を使用しています。既存の液体冷却技術は 100 キロワットのフリートを冷却することに成功しており、今後の期待が高まります」したがって、コンピューティング能力におけるもう 1 つの非常に重要な要素は、環境全体を効果的に冷却するのに十分な能力があるかどうかです。」