ニュース

新華網金融観察|大規模モデルの実装と応用: 困難と突破口

2024-09-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

新華網、北京、9月18日 質問: 大規模モデル実装のアプリケーションに関する観察: 困難と突破口
記者 蘭暁寧、陳廷宇、リン・ジーウェイ、趙秋岳
大規模なモデルが多すぎますが、大規模なモデルを実行して使用する必要があるアプリケーションが少なすぎます。大規模なモデルの実装の「ラスト マイル」をどのようにうまく進めるかが、業界内外で最近の議論の焦点になっています。
まさに「100モデルの戦い」の始まりと言っても過言ではない。現在、中国サイバースペース管理局には 190 を超える大規模モデルが登録されており、登録ユーザーは 6 億人を超えています。今年は大手機種会社が軒並み値下げし、最安値での無料通話も実施した。 「モデルを丸めるのではなく、アプリケーションを丸めてください。」ある有名企業は、大型モデルトラックにおける競争がエコロジーの構築と「顧客の獲得」という新たな段階に入ったことを反映して、この見解を何度も表明しました。 。
百花を咲かせることから、大規模モデルアプリケーションはどのような課題に直面し、どのように問題を解決してエコシステムを活性化するのか?最近、記者は大型モデルの開発会社、設計・研究開発機関、製造会社、端末メーカーにインタビューし、大型モデルがどのように研究開発を促進し、生産の品質と効率を向上させ、経営陣がユーザーエクスペリエンスを向上できるようにするかの背後にあるストーリーを探りました。
科学研究と生産関係を再構築する大型モデル
私たちは現在、ai が科学研究の生産性と生産関係の再構築をもたらす重要な時期にいます。 2018 年に初めて提案されて以来、ai は科学研究の分野に革命的な影響をもたらした新しい科学研究パラダイムとして、学術コミュニティで合意に達しました。新しいテクノロジーの強化により、科学研究の効率が向上し、科学研究における独自の革新が促進され、人工知能が科学研究にもたらす大きな価値が証明され、ai大型モデルを主導する科学研究チームは実りある成果を達成しました。
中国科学院の学者で嘉庚イノベーション研究所の名誉所長であるtian zhongqun氏は、aiは理論計算の可能性を生み出し、アルゴリズムの改良と計算能力の向上により計算効率が大幅に向上したと述べた。同氏は例えを用いて、「基礎的な科学研究を行うのは、崖だけがあって道がない孤島にいるようなものです。今日、ai は科学研究者が波に乗って崖を登る機会を得るのに役立つツールを提供しています。」と述べました。
電気化学の分野では、科学研究は新エネルギー産業化の問題を解決する必要があります。例えば、新エネルギー貯蔵発電所、特に大規模エネルギー貯蔵発電所で安全上の問題が発生した場合、その影響は非常に深刻になります。電気化学用の ai テクノロジーは、エネルギーの安全性をより確実に保証し、検出、制御、フィードバック、および制御をより適切に行うことができます。別の例として、バッテリー エネルギー貯蔵システムでは、パラメーターの収集、処理、フィードバックに大量のデータが必要となり、従来の手動処理方法に依存すると、最速で数日かかる場合があります。しかし、ai の場合は、数時間、数分、さらには数秒で十分かもしれません。
「ai は、科学者が問題をより迅速に発見し、問題を分析し、問題についてフィードバックを提供し、アクティブな制御を実行して閉ループを形成するのに役立ち、安全性と効率を効果的に向上させます。」
タンパク質はあらゆる生命活動の物質的基盤であり、分子生物学の「最高の宝石」とも言えます。 shenzhen technology がリリースした大規模な uni-mol 分子構造モデルに基づいて、分子の生成や特性予測などのさまざまな汎用機能を実現できます。創薬分野では、uni-molをベースに開発された仮想ダイナミクス分子生成手法であるvd-genにより、タンパク質標的キャビティ内に高い結合親和性を持つ分子を直接生成することができます。
shenzhen technology の共同創設者兼 ceo である sun weijie 氏は、近年、shenzhen technology とその協力者が dpa 分子シミュレーションの大型モデル、uni-mol 分子立体構造の大型モデル、uni-fold の大型モデルを発表したことを紹介しました。タンパク質フォールディング、および uni-rna 遺伝子配列の大規模モデル。大規模モデル、uni-dock 高性能分子ドッキング エンジン、uni-smart 科学文献マルチモーダル大規模モデルなどの一連の科学大規模モデルとその基礎となるエンジン。
shenzhen shi yuzhi science 大型モデル システム (写真提供: shenzhen shi technology)
現在、地球上には既知のタンパク質が約 2 億種類存在しており、それぞれのタンパク質は独自の空間構造を持っています。自然界における生命進化の長いプロセスの後、タンパク質分子は自発的に折りたたみプロセス全体を瞬時に完了することができます。しかし、科学者がアミノ酸分子間の相互作用を計算して、それらがどのように折り畳まれるかを予測したい場合、考えられるすべてのタンパク質の構成を使い果たすには、宇宙全体の年齢よりも長い時間がかかるでしょう。
「現在、ai技術を使用することで、タンパク質の三次元立体構造を非常に短時間で正確に計算できるようになりました。科学者はまた、自然界には存在しないタンパク質を設計したり、特定の機能に応じて既存のタンパク質を改変したりするためのaiの使用をさらに研究しています」 molecular heart の科学者、創設者、主任科学者である計算生物学教授 xu jinbo 氏は、「ai によるタンパク質構造の予測により、人々のタンパク質に対する理解、タンパク質がその生物学的機能をどのように実行するのか、タンパク質間の相互作用の理解が大幅に向上しました」と述べています。これにより、生物学、医学、薬学の分野に重要な影響を与える生命の分子プロセスをより深く理解できるようになり、たとえば、ai タンパク質構造予測を通じて、正確なタンパク質ターゲットをより迅速に見つけることができます。より効果的な薬剤分子の設計を支援します。」
xu jinbo 氏は、大規模な ai モデルが生命科学の問題を解決するのに特に適していると考えています。 「コンピューティングと生物学を組み合わせた最も成功した例は、ai のタンパク質構造予測です。これは生物学、さらには科学界全体に対する ai の最大の貢献です。しかし、これは始まりにすぎず、終わりには程遠いです。」 」
molecular heart が独自に開発した大規模 ai タンパク質生成モデル neworigin (darwin) は、配列、構造、機能、進化を統合した大規模 ai タンパク質基本モデルであり、高度に専門的かつ複雑なマルチモーダルデータと大量の学習を行っています。産業用途に応じて「オーダーメイド」の機能性タンパク質をご利用いただけます。現在、neworigin大型モデルは、革新的な医薬品の研究開発、材料、食品、化学産業、農業などの分野で、高分子医薬品の設計、極限環境におけるタンパク質の安定性の最適化、酵素活性の最適化、酵素などの分野で広く使用されています。 - 特異的基質ドッキング、タンパク質 デノボ設計など、さまざまな種類の困難な産業タスクでブレークスルーを実現します。
科学研究における大型 ai モデルの支援は、地球から遠く離れた深宇宙へと移行しており、深宇宙探査の分野で重要な役割を果たしています。中国科学院の学者で中国月探査プロジェクトの初代主任研究員である欧陽紫源氏は、人類の深宇宙探査活動の急速な進歩に伴い、検出データは飛躍的に増加したと述べた。データ管理に関しては、我が国は先行者利益を達成していますが、データ活用に関しては、我が国は既存の人工知能技術の優位性を最大限に発揮する必要があります。
返送されたサンプルの検出に加えて、月の地質進化に関する人類の研究は主に、衝突クレーターの特定などの月の地質学的対象の研究に依存しています。衝突クレーターの大きさ、深さ、形状、その他の特徴は、月の地質学的進化を研究するための重要な基礎となります。統計によると、月面上の直径1キロメートル以上の月衝突クレーターの数は現在100万個を超えており、直径1キロメートル未満の衝突クレーターの数はまだ判明していない。完全に手作業に頼った場合、すべての月衝突クレーターの特定を完了することは「ほぼ不可能」です。
2024年のデジタル博覧会で、中国科学院地球化学研究所とアリババクラウドは共同で世界初の「月科学マルチモーダルプロフェッショナル大型モデル」(以下「月プロフェッショナル大型モデル」)を公開した。この大規模モデルは、alibaba cloud tongyi シリーズのモデルに基づいて構築されており、現在、月の衝突クレーターの年齢と形状を特定する精度は 80% 以上に達しています。月のプロフェッショナル大型モデルの適用により、科学研究の効率が大幅に向上しました。科学研究​​者は、月の衝突クレーター画像と関連する質問を入力するだけでよく、月のプロフェッショナル大型モデルは、一般的なビジョンとマルチモーダルモデルを呼び出してデータを生成できます。 17 種類のマルチモーダル データ (スペクトル、標高、重力などのデータを含む) から画像に対応するモーダル タイプを決定します。
大規模な科学研究モデルの実装には、基礎となる科学法則の理解が必要です
ai の大規模モデルは科学研究に大きな価値をもたらしましたが、下流産業における大規模な科学研究モデルの実装は依然として、関連するシナリオの一連の課題に直面しています。
xu jinbo 氏は、大規模なタンパク質生産モデルの開発には、アルゴリズム、計算能力、データなどの必要な基本条件に加えて、2 つの主要な専門的高度な能力も必要であると考えています。1 つは、コンピューター、生物学、物理学などの統合です。 ai、分子動力学などの科学、量子コンピューティングなどの手法に精通しており、配列と構造、主鎖と側鎖、進化とオミクスなどの分野を超えた統合能力を実践的に並行して検討できる。 2 つ目は、実験室から抜け出して実際の産業環境に没頭し、需要、検証、実装の面で実際の産業ニーズに近づく能力です。現在、これらの能力と条件を備えた人材チームは非常に不足しています。
sun weijie 氏は、ai はミクロの世界で重要な問題を解決しようとする前に、まずミクロの粒子宇宙の科学法則と数学的分布を学習する必要があると考えています。
「既存のアルゴリズム システムとモデル システムがもたらすのは、原子から始めて世界を真に再構築する機会です。ai の爆発は、生産ツール、生産性、生産関係を再構築するための体系的な機会を科学研究にもたらしました。原子から始めて、ソフトウェア、データ、表現、最終的な製造リンクはすべて再構築されます。デジタル世界の繁栄は大規模なモデルの開発を促進しましたが、より注意を払う必要があるのは、長期的な最終目標、そして ai の再構築の最終目標です。 「スマート原子製造」の時代に向けて、科学研究の生産性は向上するだろう」と彼は述べた。
「物理世界は微細な粒子で構成されており、問題となるのは微細なレベルでの分子構造、タンパク質の遺伝子配列、分子シミュレーションなどです。これらの新しいモードは、従来の大きなモデルではカバーして処理することができません。これは、宇宙のすべての根底にある科学法則を真に理解する方法です」と sun weijie 氏は述べています。
同氏はさらに、ai の大型モデルは微細な粒子の世界を理解し、微細な世界の問題を解決する必要があると詳しく説明しました。微細な粒子の世界は目に見えず無形であるため、非常に有効なデータが不足していることがよくあります。 「ミクロの世界において、現時点で最良かつ実証済みの手法は、科学向け ai です。科学向け ai は、人工知能を基礎科学研究と密接に統合し、ai にミクロの世界を理解する能力を与え、新しい科学研究パラダイムを切り開きます。ワールド モデル、デジタル ワールド モデル、および身体化されたインテリジェンス モデルの 3 つの柱は、今日の ai 分野における仕事と起業家精神の 3 つの主要な軌道を構成しています。ai for science は、ai の 3 つの柱の 1 つであり、その入り口です。 agi への唯一の方法です」と sun weijie 氏は言いました。
大規模モデル対応の製造には、より深い統合とアプリケーションが必要です
ai ラージ モデルは製造業のあらゆる側面に徐々に浸透しており、製造業のインテリジェンス、柔軟性、自動化につながるコア テクノロジーの 1 つとなり、製造業に新たな機会をもたらしています。
政府レベルでは、製造分野における大型モデルの具体的な応用と革新を積極的に推進しています。今年4月、工業情報化省科学技術局は、生産と製造における人工知能の普及促進を提案し、「人工知能と製造の深い統合を主な方針とする」と強調した。 、一般的な大型モデルと業界の大型モデルをレイアウトし、人工知能を加速し、新しい産業化を促進します。
この傾向に導かれて、家電、自動車、化学などの多くの業界が大規模な ai モデルの適用を検討してきました。
射出成形は、洗濯機を製造するための重要なプロセスです。製造プロセスは単に金型を開いたり閉じたりするだけのように見えますが、その背後には、温度、圧力、成形サイクル、金型の状態、エネルギー消費などの複雑なプロセスとパラメータが関係しています。以前は、デバッグは手動の経験に頼るしかありませんでした。現在、射出成形プロセスの「ブラック ボックス」問題は解決されました。
ハイアール天津洗濯機相互接続工場に入ると、cosmoplat が独自に開発した tianzhi 産業モデルが、射出成形マスターの産業経験を定量化可能なデータと指標に変換していることがわかります。関連担当者は、大型射出成形モデルとエキスパートモデルを合理的に適応させることで、射出成形機の全体的なエネルギー消費量を最適化し、6%~10%削減でき、生産サイクルタイムを短縮できると述べました。 5%~12%増加しました。 tianzhi産業大型モデルは、産業言語を読み取り、産業プロセスとメカニズムを理解し、産業実行命令を生成し、産業機械制御を実行できることがわかっており、天津と仏山にあるハイアールの洗濯機相互接続工場で使用されています。
写真はハイアール天津洗濯機連系工場の射出成形設備(写真提供:kaos)
「自動車の生産および製造における産業シナリオとプロセスには、接着剤の使用量の多さ、人件費の高さ、最適化が必要な生産スケジュール、手動で最適なプロセス配置を達成するのが難しいプロセス設計などの共通の問題点があります。」中国産業インターネット研究院 2024年に開催された「生成型人工知能+自動車」の需要と供給のドッキングおよび業績変革イベントでは、多くの自動車会社が業界が直面している一連の課題について言及した。
gac aian new energy vehicle co., ltd.の副ゼネラルマネージャー、zheng chunqi 氏は次のように述べています。 yunchong technology group co., ltd.の自動車産業ディレクター、ye tongsheng氏はさらに、大型モデルの分析機能により、車両生産プロセス全体の品質を監視できると付け加えました。
石油化学産業のインテリジェント化、産業機器のインテリジェント化、実験研究の高効率の観点から、接触分解セトラーコーキングのインテリジェント予測技術は、接触分解セトラーコーキングの問題を解決できます。中国石油大学国家重油重点実験室のデン・チュン教授によると、生成人工知能は、物質認識、反応メカニズム、コア機器、プロセスの最適化、そしてシステムの最適化。
しかし、製造レベルでの大規模な ai モデルの実装は順風満帆ではありませんでした。この調査では、製造企業が膨大な量のデータを保有しており、著しく断片化しているため、データを効果的に集約して価値をもたらすことが困難であることが明らかになりました。さらに、大規模モデルの計算能力コスト、導入コスト、試行錯誤コストは比較的高く、特に産業用 ai 技術人材が不足しています。
「製造企業における大規模なモデルの適用には、アルゴリズム エンジニア、データ エンジニア、および最前線の企業マネージャーの共同の努力が必要であり、特にデータの収集と注釈付け、モデルの微調整、海南省人工知能協会の副会長であり、浙江省工商連盟のデジタル委員会のメンバーであり、aiテクノロジー企業リアル・インテリジェンスの創設者でもある孫林軍氏は、製造業の複雑なサプライチェーンに直面してこう述べた。 real agent インテリジェンスは、rpa の助けを借りてデータを統合し、最適化することができます。大規模モデルの助けを借りて、データ使用量のしきい値を削減し、推論と rpa によって複雑なビジネス オペレーションを分解できます。ビジネスオペレーションを自動的に完了するようにスケジュールされており、モデルの合理的な制御を通じてコストとコンピューティングリソースを展開でき、それを原材料の調達に適用できます。さまざまなビジネスリンクでコストを削減し、効率を向上させるのに非常に優れた役割を果たします。在庫管理、生産計画、物流物流などのプロセス。
多くの課題に直面しているにもかかわらず、インタビューを受けた企業の大多数は、製造業における ai の大規模モデルの応用の可能性は依然として広いと強く信じています。
中国電子学会の徐暁蘭会長は、我が国は完全な産業システム、大規模な産業規模、豊富な応用シナリオ、豊富なエンジニアリング人材などの利点を最大限に発揮し、aiの基盤を強化するよう努めるべきだと提案した。テクノロジー、ai統合アプリケーションの深化、産業開発エコロジーの改善、および深化人工知能テクノロジーの力を借りて、新しい生産力の開発を加速し、新しい産業化を促進します。
大型モデルの端末導入がaiの大規模普及を促進
大規模なクラウド モデルが ai の強力な技術的能力を実証するのであれば、オンデバイス ai は ai テクノロジーの恩恵の普及を加速するキャリアとなります。
オンデバイス ai がこれほど人気が​​あるのはなぜですか? citic construction investment は、オンデバイス ai が ai 開発の次の段階であり、大規模モデルに端末ハードウェアを搭載することで、ai アプリケーションの波が始まることが期待されると述べた調査レポートを発表しました。
端末メーカーのレイアウトから、oppoは今年約5,000万人のユーザーの携帯電話にai機能を搭載することを提案しており、xiaomi su7はaipcの「オールインワン・マルチ端末」戦略を本格的に推進している。大型aiモデルを搭載しており、changhong tvの多くのシリーズにはchanghong yunfan aiが搭載されており、端末側への大型モデルの参入が加速していることがわかります。
写真は端末側での大型モデルの分布と配置を示しています(出典:iresearch)
大きなモデルを小さな端末に組み込むことには、無限の可能性と課題があります。 zhipu ai の ceo、zhang peng 氏の見解では、より低い送信量に基づいてモデルをよりスマートにする方法と、大規模モデルの動作をサポートするためにモバイル端末上に独自のリソースを提供する方法が、大規模モデルが直面する主要な問題の 1 つです。ターミナルの問題に入る。
zhipu ai はわずか 5 年前に設立されましたが、今ではモデル開発の分野で新星になりました。大規模なモデルを実装するためのスペースをどのように作成するかについては、協力が鍵であると zhang peng 氏は考えています。システムと一連のエコ技術メーカーが協力する必要がある。「zhipu ai は、intel、qualcomm などと協力して、pc、携帯電話、自動車などのさまざまな端末上で大型モデルを実行できるようにしました。
「フロントカメラをオフにする」、「コンピューターの音量をミュートにする」、「読書習慣に合わせて要約を生成する」...消費者は、特定のブランドの新しいコンピューターの方が使いやすいことに気づきました。コンピュータと簡単な会話をするだけで、複雑な操作を置き換えることができます。メーカーによれば、将来のバージョンの反復では、電子メールの編集と送信、パーソナライズされたポスターの作成、写真に含まれる意味の理解など、より難しい機能の実装をユーザーが支援できるようになるとのことです。
「2022年に、レノボは大型モデルを現地に配置する計画を開始した。」 レノボ・グループのグローバル中小企業向け製品およびソリューション担当ゼネラルマネージャーの鄭愛国氏は、当時は大型モデルのパラメータが大きすぎて難しかったと述べた。現地で運ぶため。昨年まで、大規模モデル開発会社は焦点を 6 ~ 7b に下げており、lenovo は大規模モデルのローカル プランの実装がそれほど難しくなくなっていることに気づき始めました。昨年 5 月、lenovo は大規模なクライアント側 ai モデルを pc プロジェクトと組み合わせました。
xiaomi groupのai研究所所長であるwang bin氏は、一方ではモデルが小型化し、他方ではコンピューティング能力が増大し、さまざまな需要と相まってハードウェアの能力も強化されていると予想している。端末側のいくつかのキラーとなる ai アプリケーションになります。
記者は、電子商取引プラットフォームで販売されているai携帯電話製品をくまなく調べたところ、音声、画像、aiアシスタントがai携帯電話の最も集中した3つの機能ポイントであることがわかりました。現在、主流の携帯電話メーカーは、aiの非効率化を図るために軽量かつ大型のモデルを積極的に展開し、aiの応用シナリオを精力的に開発している。一部の市場調査レポートは、パーソナル インテリジェント アシスタントとオフィス機能の向上という点で、ai 携帯電話の価値がさらに高まると予測しています。各端末に独自の ai アシスタントが組み込まれることが現実になりつつあり、誰もが楽しめる ai の未来と考えられています。
ai 画像認識、音声ウェイクアップ、コンピュテーショナル フォトグラフィーなどのエンドサイド ai のユースケースは単純に見えるかもしれませんが、実際には、チップのコンピューティング能力と ddr 帯域幅に対して非常に強力な要件があります。
スマートフォンにおける ai ユースケースの急速な成長は、企業としてのクアルコムの重要性を浮き彫りにしています。 「クアルコムは、設計の最初から ai の概念を soc 全体に統合しました。中国におけるクアルコムの ai 製品技術責任者、wan weixing 氏は、ddr 帯域幅における大型モデルの課題に対応して、クアルコムが開発したと述べました。」モデルのサイズを縮小するための量子化テクノロジー、圧縮テクノロジー。高いコンピューティング能力を必要とする大規模なモデルのために、クアルコムはさまざまなユースケースの多様なニーズを満たすために、npu 上で非常に専門的な設計を行いました。
また、数百のモデルが乱立しており、エンド側の大型モデルは多くのカテゴリに細分化されていますが、異なる端末上のモデル間の通信機能はまだ確立されていません。したがって、中関村知能人工知能研究所の孫明軍所長は、「将来的には、技術標準の統一と相互運用性は、すべての関係者が解決する必要がある非常に大きな技術的問題となるだろう」と述べている。
「アプリケーションは王様」という概念は、大規模モデル テクノロジの開発と実装において特に重要です。調査とインタビューを通じて、業界関係者は大規模モデルの真の価値は実際的な問題を解決し、ユーザーにとって真の価値を生み出すことにあるということに概ね同意しました。
「人工知能+」の取り組みが深化するにつれ、複数の当事者の協力により、大規模モデル技術が「フライホイール効果」に乗って数千の産業に力を与えるだけでなく、新たな生産性の高い産業の形成を加速することが期待されています。テクノロジーの反復とパフォーマンスの向上により、大規模モデル アプリケーションの新たな領域が開かれます。
レポート/フィードバック