ニュース

北京の新たな生産性を訪ねて・実験室の外へ|北京知源人工知能研究所所長の王忠元氏:素晴らしい

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

「鍾源と呼んでください。」 彼はディーン・ワンよりもこの称号に慣れていました。

2024年2月、北京知源人工知能研究院(以下「知源」)は、王忠源氏が2018年の「MITテクノロジーレビュー「35歳以下の技術革新者35人」に選出される」と発表した。 Microsoft、Facebook (現 Meta)、Meituan、Kuaishou での勤務経験を持つテクノロジー界は、この「85 年代以降」の学部長の頭の中の人工知能の現在と未来について聞くことに非常に興味を持っています。今年3月、中国共産党中央委員会政治局常務委員で国務院首相の李強氏は、大規模伐採の研究開発について詳しく学ぶため、北京での調査中に知源市を訪れた。 -エッジテクノロジー。

1時間近く続いた独占インタビューの中で、王忠源氏と北京ビジネスデイリーの記者は、人工知能業界で打破する必要がある現在のボトルネックとバブル、中国と米国のインターネット発展の違いについて語った。国内大型モデルの価格戦争の行方、スマートソースの位置付けや開発計画などについて、綿密な意見交換を行った。


【業界の振り返り】

大型モデルが「9.11と9.8どっちが大きいの?」と迷うのも不思議ではないでしょうか。

Q: 「9.11 と 9.8 のどちらが大きいですか?」という質問は、最近多くの大手モデルを悩ませていますが、この結果についてどう思いますか?

A: まったく驚きません。研究者の視点から見ると、大型モデルのすごさは、これまで人工知能では解決が難しかった理解、推論、常識の問題を解決できる点にありますが、数学などすべての問題を解決できるわけではありません。大規模なモデルは、一見簡単な数学問題ではうまく機能しないことがわかりました。数値的なサイズの問題を解決できなくても、大規模モデルの継続的な進化や産業上の実装が妨げられることはありません。

Q: 大型モデルが普及して 1 年半が経ち、業界の判断はより合理的になってきましたが、人工知能はバブルの臨界点に達したと思いますか?

A: いわゆるバブルの臨界点には程遠い、これは私が強く信じている見解です。大きなモデルはまだ始まったばかりです。 iPhone の誕生から、使いやすいと一般に認められている iPhone 4 や iPhone 4S に至るまでには 4 年かかりましたが、大型モデルが研究室から業界に届くまでには 1 年半しかかかりませんでした。 , 大規模なモデルの機能を継続的に改善し、さまざまなシナリオをターゲットにしてアプリケーションを磨き上げる必要があることに同意します。

【価格競争】

100モード戦争は当社の市場化が良好であることを証明しています

Q: 100モード戦争が始まった今、価格戦争についてはまだ不安はありますか?

A: 大規模なモデルの反復には継続的な投資が必要です。数百のモデルの戦争は明らかに基本的な大規模なモデルの開発には役に立たず、リソースの分散を引き起こします。価格競争の利点は、大規模モデルの研究開発に実際には投資していない一部の企業を除外できることです。また、シナリオを発見し、シナリオに従ってアプリケーションを磨き上げるのにも役立ちます。しかし、価格競争のせいで、iPhoneのように、常に第一世代の製品を比較してしまうと、目指す目標からどんどん遠ざかってしまう、という企業が現れないことを祈ります。 . これは見たくないものです。

Q: 価格競争が避けられない場合、大規模モデルの toB (企業) に対してどのような提案がありますか?

A: toB エコシステムを構築するには、企業がソフトウェア、大規模なモデル、知識に対して喜んでお金を払う必要があります。これが私が特に訴えたいことです。このようなエコロジーが形成されて初めて、大型モデルの開発や大型モデルを使用する企業の発展に有益となります。

価格競争は、大規模モデルの包括性を促進するための単なる手段です。さらに重要なのは、大規模モデルの効果です。私は、大規模なモデルが B 側で効率の改善を見つけることができるシナリオ、または企業が大規模なモデルが問題をより適切に解決できるシナリオを見つけることをより楽しみにしています。これは、B 側の大規模なモデルが解決する必要があるものです。今後 1 ~ 2 年で、成熟した B サイドの大規模モデルが適用されるのが見られるかもしれません。

ユーザーの研究開発担当者は経験に非常に敏感で、大規模モデルでは「9.11 と 9.8 のどちらが大きいか」という問題に直面するのが普通だと信じているため、大規模モデルの toC (ユーザー) はさらに忍耐が必要になる可能性がありますが、ユーザーはそれを受け入れることができません。この質問はしません。

Q: 中国のインターネット上では、数百のグループによる戦争や数千の放送による戦争が行われてきましたが、この数百のモデルによる戦争はどのように終わるのでしょうか?

A: 米国では、各業界や分野で 1 社か 2 社の巨人が出現すると、他の企業が差別化を始めます。中国ではインターネットとモバイルインターネットの両方が十分な競争を経験しており、これは当社の市場化が良好であることを示していると思います。この場合、最終的に勝つ企業はより競争力があり、より効率的になるでしょう。

【知恵】

大学ができない、企業がやりたがらない研究開発をやらなければなりません。

Q: 人工知能は大型モデルと同じではありません。大型モデルの能力に匹敵するための Zhiyuan の計画は何ですか?

A: 人工知能の開発には、シンボリズム、コネクショニズム、行動主義という少なくとも 3 つの主要な学派があり、それぞれナレッジ グラフ、ニューラル ネットワーク、エージェントに対応します。大規模モデルはニューラル ネットワークの一部門にすぎません。大規模モデルが異なる理由は、ニューラル ネットワークを通じて大量のデータを圧縮し、常識と推論の進歩を確認できるためです。確かに、大型モデルは人工知能と同等ではありませんが、大型モデルは現在の人工知能の重要な原動力であり、人工知能のイノベーションのリーダーになるというウィズダムのビジョンがあります。私たちは引き続き、困難な問題を解決するために大規模モデルの方向に多くのリソースを投資しますが、大規模モデル以外の人工知能テクノロジーも引き続き展開します。

たとえば、少し前に、Zhiyuan は、大規模言語モデルに関する一般的な研究に加え、マルチモダリティ、バイオコンピューティング、および身体化インテリジェンスの 3 つの方向における最先端の研究を含む大規模なモデル ファミリー バケットをリリースしました。Zhiyuan は脳の大型モデルも行っています。 -インスピレーションを受けた研究、デジタルハートなどの研究。

Q: Wisdom は、科学技術省、北京市党委員会および政府の指導と支援の下、2018 年に設立されました。現在、人工知能は新たな生産性の開発にとって重要な原動力となっています。この中でZhiyuanはどのような役割を果たしていますか?

A: Zhiyuan は、中国の科学研究システムにおいて独自の役割を果たしている独立した非営利研究開発機関です。大学モデルは数十年にわたって運用されており、組織的かつ大規模かつチーム横断的な方法で体系的な研究開発を実施することは困難です。企業も研究開発に投資しますが、熾烈なビジネス競争と生き残りのプレッシャーに直面しているため、ビジネスと密接に関係する研究開発を好みます。 Zhiyuanは、大学ができない、企業がやりたがらない研究開発、成果が出るまでに3~5年、あるいはそれ以上かかる研究プロジェクトも行います。

Q: Zhiyuan は、主要な科学的問題に常に注力している新しい研究開発機関です。今後 3 ~ 5 年間の計画は何ですか?

A: 2024 年の北京インテリジェント ソース カンファレンスで発表された研究の進捗状況と結果が、私たちの答えです。人工知能全体、特に大規模言語モデルから統合マルチモーダルまでの大規模モデル技術の開発傾向について判断しました。次に、身体化された知能と生物学的コンピューティング モデル、そして最後に世界モデルと AGI (汎用人工知能) これは、主にいくつかの技術的問題を克服するための、人工知能技術全体の開発に関する私たちの判断です。

ネイティブマルチモーダル大規模モデルは、テキスト、画像、ビデオ、音声などのさまざまなモーダル情報を最初から 1 つのモデルに入れて学習します。このようなマルチモーダル大規模モデルは、人間の脳のように理解して推論することができます。

大きなモデルとハードウェアの組み合わせ、つまり身体化された知能は、将来の非常に重要な開発の方向性であり、これにより人工知能が仮想世界に存在するのではなく、物理世界に入って人間に奉仕できるようになります。

ミクロの観点から見ると、人工知能技術は生命分子を理解し、モデル化し、推論することができ、AI 製薬と製薬業界全体に大きく役立ちます。

Chiyuan 氏は、人工知能が人間と同じように世界をモデル化し、最終的には AGI を実現できることを望んでいます。

Q: 大型モデルの波に追いつくために、企業はプレッシャーや課題に直面していますか? Zhiyuan も緊張していますか?

A: 現在、人工知能業界全体が確かに多くの課題に直面しており、同時に熾烈な競争が繰り広げられており、最終的には誰が転ばずにより速く走れるかを競うことになります。

Zhiyuanは人工知能の独自の革新に焦点を当てており、不安は主に、人工知能技術の分野で国が緊急に必要としている技術的ブレークスルーを達成できるかどうかに由来しています。したがって、Zhiyuanは、自分が何をしたいのかを明確にするだけでなく、これを行うことで本当にブレークスルーを達成でき、最終的には人工知能全体、さらにはより大きな業界の発展に利益をもたらすことができるかどうかを明確に考える必要があります。

【人材育成】

若者が主役となり、若者が志源のラベルとなった

Q: 「85 年代以降」の学部長として、あなたは非常に若く、大手インターネット企業で豊富な経験を持っていますが、このレーベルについてどう思いますか?

A: 過去 10 年間の私の個人的な経験は、大きく 2 つの段階に分けられます。1 つは卒業後に Microsoft Research Asia に入社し、その後、純粋に科学研究機関から企業に入社しました。人工知能技術を特定のビジネスに応用します。インターネット業界では、私はもはや若手ではなくベテランとみなされています。

科学研究機関では、1985 年以降生まれの人が学部長になれるのは比較的若いと考えている人が多いですが、これがまさに志源の特徴だと思います。ウィズダム ソースでは、年功序列に関係なく、若者が主導権を握ることを奨励しています。ウィズダム ソースの非常に重要な科学研究プロジェクトの多くは、非常に若い研究者によって行われています。たとえば、大規模なネイティブ マルチモーダル モデルの担当者は 30 歳未満、大規模なバイオコンピューティング モデルの担当者は 30 代前半、大規模な身体化モデルの担当者も約 30 歳です。私は、若さが私の個人的なラベルであると言うのではなく、Zhiyuan のラベルとして使用することを好みます。また、若く、精力的で、思慮深く、有能な若い科学者が将来の研究を行い、画期的な進歩を遂げるために Zhiyuan に参加することを非常に歓迎します。コアテクノロジーを組み合わせます。

Q: 研究開発は人材に大きく依存しています。Zhiyuan が人材を採用することにどのような利点がありますか?

A: Zhiyuan のような新しい研究開発機関の中核要素は常に人材です。 Chiyuan は、若者が能力、アイデア、意欲を持っている限り、科学研究でトップの地位とプロジェクトを獲得できることを非常に重視しています。 Zhiyuan のリソース配分の多くは、中核となる優れた人材を中心に行われています。

北京経済報記者タオ・フェン・ウェイウェイ