ニュース

おもちゃや道具から「同僚」、そして「AI アインシュタイン」まで、私たちは一般的な人工知能からどれだけ離れているのでしょうか?

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


現在、汎用人工知能 (AGI) は科学界や産業界が注目するキーワードの 1 つとなっています。ほんの数年前までは、AGI の実現には少なくとも 10 ~ 50 年かかると多くの人が信じていました。それは決して不可能です。今日、後者はほとんどいません。しかし、この技術革新の波に対する世間の興奮に比べ、AI(人工知能)分野の第一線で活躍する多くの学者や業界リーダーは、現在のAIがAGIに発展するまでにはまだ長い道のりがあると感じています。

復丹大学の郝青特別教授、上海科学知能研究所(以下「上海研究所」)の所長、そして信頼される大規模モデル会社「インフィニット・ライトイヤー」の創設者であるチー・ユアン氏の見解では、「それは、複雑な世界の未知の法則を発見することです。一言で言えば、それは「AI アインシュタイン」でなければなりません。これには、高速思考の「ブラック ボックス」確率予測と低速思考の組み合わせを作成する必要があります。 「ホワイトボックス」の論理的推論により、「グレーボックス」の信頼できる大規模モデルを作成し、テクノロジーと産業の緊密な統合を通じて、基礎研究、人材育成、結果の実装を促進し、科学的でインテリジェントなイノベーションエコシステムを構築します。

つい最近閉幕した2024年世界人工知能会議(WAIC)および人工知能グローバル・ガバナンスに関するハイレベル会議で、上海理工大学は「人工知能:科学研究のパラダイム変化と産業発展」というテーマのフォーラムを成功裡に開催した。この新しい研究開発機関がWAICに登場するのも今回が初めてです。商志研究所は、イノベーション主導の「1+1+N」科学的インテリジェント生態モデルを探求する上海のモデルであると言えます。つまり、商志研究所の「1」は、生態系の中心およびハブとして機能し、責任を負います。全体的な戦略計画、資源統合、主要技術の研究開発と革新を、もう一つの「1」復旦大学と多くの大学、科学研究機関、テクノロジー企業、イノベーションチーム、投資機関の「N」と組み合わせて共同で推進する。科学研究、人材育成、科学技術成果の変革、業界の革新とアップグレード。

AGIの標準は「AIアインシュタイン」を作ること

技術的な観点から見ると、より多くのパラメーターを備えた大規模なモデルは、一般的な人工知能につながるのでしょうか?今日、AI テクノロジー自体の観点から見ても、エネルギー消費の観点から見ても、Transformer 自己回帰アーキテクチャに基づく大規模モデルにはまだ利益がありますが、一般的な人工知能につながるには十分ではありません。人工知能には、新しい「グレー ボックス」の信頼できる大規模モデルの開発が必要です。これは、Qi Yuan の学界と産業界での長年にわたる実務経験の要約です。

10年前、Qi Yuan氏は「人工知能を役立つものにする」という考えのもと、アリババの中核となる機械学習システムを初めて200万パラメータから数億パラメータに増やし、大規模なビジネス効果を達成するチームを率いた。データ、アルゴリズム、エンジニアリング機能の統合された変換を実証します。これはまさに、今日人工知能界で話題になっているスケーリング則を具体化したものです。

Qi Yuan 氏は、チームがその時スケーリング則の利点を実際に味わったことを思い出しました。モデルのパラメーターを 100 倍に増やした後、全体の効果が飛躍的に向上しました。 「しかし今思うのは、なぜ当時、AI モデルをもっと広範囲に開発しなかったのかということです。一歩前進したのに、なぜここで止まってしまったのでしょうか。何億ものパラメータを持つ大きなモデルがまだ残っているのです。」と彼は言いました。当時、学術界も機関もコンピューティング能力が不足しており、産業界でもそのような高いコンピューティング能力を実現するには非常に高いコストが必要でした。学界は言うまでもありません。」

Qi Yuan 氏は、AGI の標準が「AI アインシュタイン」を作成することである理由は、効果的かつスマートであるためであると説明しました。まず第一に、アインシュタインは、いくつかの重要なデータ ポイントを通じて「20 世紀初頭の物理学の暗雲」を目撃しました。また、AGI は複雑な世界を理解する未知の法則を発見できるはずです。しかし、現在の大型モデルではこれを実現できるものはありません。SORA の大型ビジュアル モデルは前例のないレベルで物理世界をシミュレートしますが、SORA は 2 次元世界のシミュレーションに基づいて 3 次元世界を構築します。物理的な世界を徹底的に理解することができます。 2 つ目は消費電力です。人間の脳の電力は約 15 ワットですが、汎用の大型モデルのトレーニングをサポートするにはキロカードまたは 1 万枚のカード クラスターが必要であることは言うまでもありません。 。今のところ、既存のアーキテクチャを使用し続けると、膨大な電力消費が必要となり、効率的でスマートであるという目標を達成することが困難になります。

「AI アインシュタイン」は、AI for Science(注:Scientific Intelligence、以下 AI4S)の重要な目標でもあります。科学的知性は、既知の物理方程式の解決を加速する上ですでに重要な役割を果たしていますが、科学的知性は、既知のルールとデータを組み合わせ、データと計算能力への大きな依存を減らし、推論と予測の精度を向上させ、データの知識に基づいて調整する必要があります。規則を定め、新しい科学理論を提案します。これは、「人工知能を使用して複雑な世界を理解し、未知の法則を発見する」という復丹大学と上海知識産権研究所で働くというQi Yuanの長期目標とも一致する。

「グレーボックス」の信頼できる垂直フィールド大型モデルが数千の業界に力を与える

大規模モデルが AI ツールによる新しい生産性を導入する場合、緊急に解決する必要がある問題は何ですか? Qiyuan 氏の観点から見ると、大型模型業界は多くの共通の課題に直面しており、技術、製品、市場の需要を一致させることが困難です。

「現時点で、大規模モデルの実装における最大の問題は、一見便利そうに見えても、一度使ってしまうと役に立たないことです。」と Qi Yuan 氏は説明しました。今日の大規模言語モデルの核心は、単に次のことです。 「predict the next word」は次の単語を予測しますが、これは多段階の厳密な推論には適していません。 「言語はコミュニケーションのツールであり、思考のツールではない。」 最近、マサチューセッツ工科大学(MIT)などがトップ学術誌「ネイチャー」に掲載した論文では、言語は情報を広めるための強力なツールであると指摘した。それは文化的知識であり、人間の認知の複雑さを反映するために共進化した私たちの思考能力と推論能力に関連している可能性があります。しかし、言語が推論の複雑さを生み出すわけではありません。

信頼性の低さ、解釈可能性の低さ、コストの高さなどの大規模モデルの既存の特性を考慮すると、真に効果的な解決策は、ノーベル経済学賞受賞者のダニエル・カードの組み合わせと同様に、確率的ニューラル ネットワーク推論と論理的記号計算を組み合わせることです。ニーマンの著書「思考の高速化と低速化」で説明されている人間の本能に基づく速い思考と論理的推論に基づく遅い思考は、「大きな「灰色の箱」モデルであると言える」とチー・ユアン氏は信じています。シンボリック コンピューティングとニューラル ネットワークを組み合わせることで、人工知能の「幻想」を軽減し、垂直分野の専門的問題を解決できるため、何千もの業界に力を与え、大規模モデルの生産性を解放できます。

信頼の大型モデル「グレーボックス」とは? 「ディープラーニングはもともと『ブラックボックス』であると考えられていましたが、現在では論理的推論の『ホワイトボックス』とディープラーニングを組み合わせることで『グレーボックス』になります。」とQi Yuan氏は説明しました。 「データが結果を生み出すプロセスについて人々は何も知りません。また、「グレーボックス」大規模モデルは、論理的推論の助けを借りて人々に「何が起こっているのか、そしてなぜ起こっているのかを理解」させることができます。モデルは深層学習を使用して、そうでないルールを減らすことができます。現実世界の観測データと一致します。」

Qi Yuan 氏は、金融や保険、風力エネルギー、海上輸送、医療や製薬のシナリオなど、さまざまな業界の複雑なシナリオを AI が中心的な役割を果たす新たな戦場にするためには、体系的な業界知識を統合する必要があると述べました。推論ロジックと意思決定メカニズムを大規模なモデルと組み合わせます。 「グレーボックス」大型モデルは、一般的な人工知能の一般的な方向性を示すだけでなく、大型モデルが垂直分野に深く浸透し、実際の問題を真に解決するための強力なツールでもあります。 「業界の観点から見ると、この理解は非常に直感的です。」 Qi Yuan氏は例を挙げ、医師は弁護士である必要はなく、弁護士は投資の専門家である必要はありません。独自の生産性ツールを作成します。技術的に言えば、大規模なモデルが無関係なタスクで過剰学習された場合、「壊滅的な忘却」が発生する可能性があります。李白が一日中会計士として働き、詩を書かなかったら、彼の詩的インスピレーションは徐々に薄れていくかもしれないのと同じです。 「垂直フィールドで大規模なモデルをトレーニングする場合、モデルに無関係な機能を学習させすぎると、本来の機能が妨げられることが観察されました。したがって、垂直フィールドでは「グレー ボックス」の大きなモデルを作成する必要があります。産業上の実装には大きな価値があると思います。」

「『グレー ボックス』の大型モデルは、AGI と垂直産業の実装に向けてますます重要な役割を果たすようになると思います。なぜなら、ベイジアン手法では、既知の知識とデータ内の隠された未知の情報を組み合わせるからです。」新しい法則を発見し、科学的および産業的問題を解決するために」 Qi Yuan は、将来的には「AI アインシュタイン」も「AI バフェット」になる可能性があると率直に言いました。

イノベーションチェーンを開放し、科学的かつインテリジェントなイノベーションエコシステムを構築する

2024 年の世界人工知能会議で、Qi Yuan 率いるチームは、数百億のパラメーターを備えた大規模で信頼できるライトランゲージの金融および医療モデルを発表しました。これら 2 つの垂直分野における大規模モデルのテストは、OPEN AI の数兆パラメータの大規模モデル GPT4-Turbo を上回り、大規模モデルの実装に対する業界の注目が再び高まっています。

「今日の人工知能の躍進は、基礎となる原理の革新によってもたらされただけでなく、社会のニーズを志向した製品によっても推進されています。社会が必要としているのは、理論的な論文の出版やビジネスモデルの革新だけではなく、テクノロジーの深い統合です。イノベーションと産業イノベーション、これは一体性の原則における画期的な進歩に基づいており、この 2 つが組み合わされれば、私たちは水がより青い場所まで泳ぐことができるのです」と Qi Yuan 氏は述べました。

学界と産業界は異なる使命を持っています。学界は新しいことを探求しなければなりませんが、産業界はまず現実的な問題を解決しなければなりません。現在、国内外で共通の問題があります。研究機関は多くの技術革新問題を研究する必要がありますが、製品化と社会のニーズを無視すると、真の競争圧力の欠如と革新的な技術を抑制できないという2つの欠点が生じます。競争; 効果的な市場情報のフィードバックが技術の研究開発の方向性を推進します。

この目的を達成するために、Qiyuan 氏は、「大学、研究機関、スタートアップ企業」のイノベーション チェーンを開拓し、優れたイノベーション エコシステムを構築することを楽しみにしています。基盤となるテクノロジーについて考えるだけでなく、市場の需要も把握しています。市場の需要とシナリオを利用して製品の方向性を推進し、ボトムアップで革新して製品の中核的な競争力を構築します。

2023 年に設立された Shanzhiyuan は、知識とデータを組み合わせた科学向け AI の独自のイノベーションに取り組んでいます。最近、商志研究所は、新エネルギー、保険、都市管理などの産業用途向けに大規模気象モデル2.0のFuxiシリーズをリリースし、複数の部門を団結させて段階的に産業化を促進するIntelligent Weather Innovation Ecological Allianceの立ち上げを主導した。 Fuxi シリーズの大規模気象モデル 2.0。 Qi Yuan が設立した信頼の大型モデル会社「グレーボックス」の製品発売も進行中です。

科学的およびインテリジェントなイノベーションエコシステムをさらに繁栄させるために、第2回会議は上海知能学院と復旦大学が共催し、上海市科学技術委員会、上海市発展改革委員会、上海市経済情報委員会が共同指導した。委員会、上海市教育委員会およびその他の部門により、世界科学および知性コンテストが開始されました。このコンテストでは、科学的知性のフロンティア分野を共同で探索するプレーヤーを世界中から募集し、賞金 100 万ドルを設定しています。同時に、Shangzhi Institute は、マルチモーダルな科学データをカバーする科学データ プラットフォームの開発を主導しました。このプラットフォームは、データの収集から処理、管理、モデリングまでのフルリンク機能を備えており、データの効率的な処理、信頼性、安全な相互運用性を保証します。 。このプラットフォームに基づいて、SPIC とそのパートナーは、生命科学、物理科学、大気科学の分野向けに複数の高品質の科学データセットを構築し、科学インテリジェンス研究に貴重なリソースを提供しています。さらに、Shangzhi Institute は Global Scientific Data Ecological Alliance の立ち上げを主導し、第 1 陣のアライアンスメンバーユニットには、China Telecom Co., Ltd.、COSCO Shipping Property Insurance Captive Co., Ltd. (上海) など 10 を超えるユニットが含まれています。臨港新区越境データ技術有限公司。このアライアンスは、政府、企業、大学、研究機関、その他の関係者との協力を通じて、グローバルな多分野の科学研究ビッグデータリソースの開放と共有プラットフォームを構築します。

「科学研究も産業も、『新しさのための新しさ』であってはなりません。私たちは、現実世界の問題を解決するための将来の汎用人工知能とアプリケーションを構築できることを願っています。」と Qi Yuan 氏は述べました。

著者:

写真:写真提供:上海情報研究所 編集者:呉錦暁 編集長:蒋鵬

この記事を転載する場合は出典を明記してください。