DeepMind 創設者への最新インタビュー: AGI は 10 年以内に登場し、医療エネルギー環境を再構築する

2024-08-19

タオ・レーはアオフェイ寺院に由来します
パブリックアカウント QbitAI

AGI はいつ実装されますか?グーグルディープマインド CEOのハサビス氏は最新のインタビューで次のように予測した。

10年。

もし汎用性今後10年以内にそれが現れても驚かないでしょう。

今回のインタビューでは、ハサビス氏がAIの開発トレンドについて語った。

次のような誰もが興味を持つトピックがいくつかあります。

AI は短期的には過大評価されるかもしれませんが、長期的にはその可能性と影響は過小評価されたままです。

Google の「スーパーチーム」として、Google DeepMind は商業的利益と科学研究の間のバランスを見つける必要があります。

オープンソースは技術の進歩にとって重要ですが、悪用される可能性のあるテクノロジーに遭遇した場合は、悪用を評価して制限するためにオープンソースにするまで 1 年待ったほうがよいかもしれません。

より具体的な内容については、以下のテキスト版をご覧ください~

初期AIの「実装問題」

質問: 今日のインタビューには、DeepMind の共同創設者であり、Google DeepMind の現 CEO である Hassabis 氏をお招きしました。

ハサビス: ありがとうございます。インタビューに参加することができてとてもうれしいです。前回は、シミュレートされた環境や、周囲の世界を理解するために必要な実際の知性を備えたロボットなど、現実の世界で概念や言語がどのように使用できるかを見てきました。

ただし、これらのシステムはまだ理想的なレベルに達しておらず、多くの間違いを犯しており、実際には世界の完全なモデルを構築していないことを認識する必要があります。それでも、彼らは言語学習だけで私たちの予想をはるかに超える進歩を遂げました。

質問: はい、前回は現実世界に言語を実装する方法についてたくさん議論しました。しかし、「着陸」が何を意味するのか簡単に説明できますか?初めてインタビューを見ている友人が理解できない場合に備えて。

ハサビス："着陸"このコンセプトは、1980 年代から 1990 年代に MIT などの学術機関で構築された古典的な AI システムが起源です。これらのシステムのほとんどは巨大な論理システムであり、相互に関連する多くの単語を含む巨大なデータベースとして想像できます。

ただし、問題は、データベース内で「犬には 4 本の足がある」などのステートメントを見つけることはできても、システムが本物の犬の写真に直面した場合、それらのピクセルをデータベース内のシンボルと関連付けることができないことです。、これはいわゆる「着陸問題」です。

言い換えれば、システムは象徴的または抽象的な表現を持っていますが、現実世界におけるこれらの表現の具体的な意味を理解することはできません。それ以来、人々はこの問題を解決しようと試みてきましたが、完全さを達成することはできませんでした。

過去のシステムとは異なり、今日の AI システムはデータから直接学習し、最初からデータと現実世界の間の接続を確立します。

興味深いことに、たとえこれらのシステムが最初は言語のみに基づいて学習したとしても、理論的には「軌道に乗る」ために必要な多くの情報が不足しているはずです。なぜなら、これらのシステムは現実世界のシミュレーター、ロボット、その他の形式の入力に接続されていないためです。それは言語空間での学習です。

しかし、驚くべきことに、これらのシステムは依然として現実世界に関するある程度の知識を推測することができます。

質問: これは、人々がシステムと対話するときに、どの答えが正しくてどの答えが間違っているかをシステムに伝えるためである可能性があります。このようにフィードバックすることで、システムは「着陸」情報の一部を受け取ることができ、徐々に現実世界とのつながりを確立していきます。

ハサビス: 確かに、以前のバージョンのシステムが、「犬はどのように吠えるのですか?」などの質問に誤って回答するなど、「着陸」情報の欠如により誤った回答を返した場合、人々のフィードバックによって修正されます。

このフィードバックは、私たち自身が「実装された」知識に基づいているため、ある程度までは、システムは、このフィードバックから情報を吸収して学習します。

短期的には誇大評価されるが、長期的には過小評価される

質問：さらに、AIの盛り上がりについてもお聞きしたいです。私たちの現在の状況、現状は過大評価されていると思いますか、それとも過大評価されていると思いますか?

ハサビス：どちらかというと後者だと思います。言いたいのですが、短期的には、誇大広告は行き過ぎています。

AI はあらゆることができると言われていると思いますが、実際には、人々が言うほど強力ではありません。あまり成熟していない非現実的なアイデアを追いかけているスタートアップやVCがたくさんいます。

しかしその一方で、今でもまだ過小評価されている、あるいは十分に注目されていないのではないかと思います。特に AGI および AGI 後の段階に到達しても、これがどのような大きな変化になるのか、そしてそれに伴う責任を人々が完全に理解していないと私は感じています。

それで、短期的には間違いなく過大評価されていると思いますが、長期的にはまだ過小評価されています。

マルチモーダルな Gemini から Astra ユニバーサル AI エージェントへ

質問: さて、このインタビューでもっと重要な質問をしたいと思います。Gemini と他の研究室がリリースした大規模言語モデルの違いは何だと思いますか?

ハサビス: 私たちは Gemini プロジェクトの最初の段階から、複数の種類のデータを同時に処理できるようにするという目標を設定しました。テキストを理解するだけでなく、音声、ビデオ、画像、コードなど、基本的にあらゆる形式の情報を解析できることを期待しています。

私たちは、システムが現実世界のさまざまな情報を理解して処理できるようにすることによってのみ、世界を真に理解し、より正確で包括的な世界モデルを構築できると強く信じています。

これは実際には上で述べた「着地」の問題の延長ですが、今回はこれを達成するための基礎として言語を使用します。

質問：やはりプロジェクト全体の鍵となるのは「実装」ということでしょうか？

ハサビス：確かに、これは重要です。

私たちには最終的な目標もあります。オールラウンドなアシスタントを作成する。というツールを開発しましたアストロプロジェクトのプロトタイプである Astro は、入力を理解するだけでなく、環境のコンテキストも感知します。

あなたの質問の文脈やあなたが置かれている状況をより深く理解できたら、パーソナルアシスタントやデジタルアシスタントがどれほど強力になるか想像してみてください。したがって、私たちは常にこの種のシステムがより実用的であると確信しています。

これを行うために、プロジェクトの最初からマルチモーダル機能をシステムに組み込みました。当時、この機能を備えたモデルはこれだけでしたが、現在は他のモデルも追いつくように努めています。

質問：Project Astro は、ビデオおよびオーディオデータを処理できる新しい汎用 AI エージェントです。Google I/O カンファレンスで、Astro がユーザーが自分のメガネの場所を思い出すのにどのように役立つかの例を示したのを覚えています。このテクノロジーの起源に興味があります。これは単なる古い Google Glass の高度な進化ですか?

ハサビス: Google にはメガネベースのデバイスの開発に長い歴史があり、2012 年頃から関与していました。したがって、この分野では、彼らは大きな先行者利益を持っています。スマートアシスタントが見ているものを理解するために必要なテクノロジーが不足していたのかもしれません。しかし今では、このデジタルアシスタントをあなたのそばに置くと、あなたの周りの世界を理解できます。, とても自然な感じがします。

質問: ジェミニの起源をたどりたいのですが、それは組織内の 2 つの別々の部門から始まり、それらの部門によって行われたからですか?

ハサビス：確かに、昨年はAlphabetを入れました。(Googleの親会社)初代の2つの研究部門ディープマインドそしてグーグルブレイン、新しい部門に統合され、私たちはそれを呼びます「スーパー部門」。

このようにして、社内のすべてのトップ人材が 1 つのチームに集められ、すべての研究分野、特に言語モデルからの最高の知識が結合されます。

これまでにも Trin Chilla や Gopher などのプロジェクトがいくつかあり、それらはすべて Palm や Lambda などの初期の言語モデルの開発に参加してきました。これらのモデルにはそれぞれ独自の長所と短所があり、合併後の最初の非常に重要なプロジェクトである Gemini プロジェクトにそれらを統合しました。

さらに、もう 1 つ特に重要な点があります。すべてのコンピューティングリソースを統合する。このようにして、実際にすべてのコンピューティング能力を結集する大規模なトレーニング実行を実行できます。Gemini をより強力かつ効率的にする。

この 2 つのチームは、常に AI の最前線に注力してきました。これまでにも個人研究で多くの協力を行ってきましたが、戦略的にはそれほど緊密ではないかもしれません。統合されたチームは、Google のチームと言えます。「エンジンルーム」。

実際、2 つのチームの仕事のやり方は非常に似ており、大きな違いはないと思います。次は次のことを考えるなど、基礎研究での優位性をさらに強化していきます。トランスアーキテクチャがどのようなものになるかは、私たち全員が自分たちで理解したいと考えています。

そういえば、前回のTransformerはGoogle Brainが作ったもので、深層強化学習と組み合わせましたが、もっと工夫が必要だと思います。 BrainでもDeepMindでも、これまでの10年と同様に貢献し続けていくと信じています。

Googleの「エンジンルーム」

質問: Google DeepMind が Google の「エンジンルーム」になったと先ほどおっしゃいましたが、これは大きな変化です。 Google が現在あなたに大きく賭けているかどうか知りたいのですが?

ハサビス：そう思います。 Google は AI の重要性を常に明確にしていたと思います。ピチャイ氏は初めてCEOに就任したとき、こう語った。Google は「AI ファースト」の企業です。

彼が最初に就任したとき、私たちはこの話題について議論しましたが、彼はモバイルインターネットに続く次の大きなパラダイムシフトとして AI の可能性を認識していましたが、その影響はこれらよりもさらに深刻でした。

しかし、ここ 1 ～ 2 年で、研究の観点からだけでなく、製品やその他すべての観点から、それが何を意味するのかを本当に理解し始めたと思います。ですから、今はとてもエキサイティングな時期ですが、すべての才能を結集して全力を尽くすのは正しい選択だと思います。

質問: 別の観点から見ると、現在 Google の「エンジンルーム」となっている DeepMind にとって、商業的利益の考慮と純粋な科学研究の間でよりバランスを見つける必要があるということでしょうか?

ハサビス：確かに、私たちは今、ビジネス上の利益をもっと考慮する必要があり、それが私たちの責任の一部となっています。しかし、まだ解明すべき点がいくつかあり、私たちは引き続き科学研究活動を推進し、この分野への投資は依然として増加しています。

私は思う、これは Google DeepMind で行っているユニークな取り組みです、競合他社でさえ、これらの結果を AI の広範な利点として認識しています。

「オープンソース」は必要だ

質問: さて、次の質問はオープンソースです。あなたが言ったように、テクノロジーが大衆の手に渡ると、かなり驚くべきことが起こる可能性があります。 DeepMind が過去に多くの研究プロジェクトをオープンソース化してきたことは知っていますが、今では状況が変わったようです。オープンソースに関するあなたの見解について話していただけますか?

ハサビス：オープンソースは必要であり、私たちは常にオープンソースとオープンサイエンスを強力に支持してきました。ご存知のとおり、私たちは、Transformer や Transformer などのプロジェクトを含む、ほぼすべての研究プロジェクトを公開しています。アルファ碁私たちはこのようなプロジェクトを「Nature」や「Science」などのトップ雑誌に掲載してきました。

AlphaFold もオープンソースです、これらはすべて私たちが作ったものです賢明に選択してください。おっしゃるとおり、このアプローチが機能するのは、情報を共有することで技術と科学が最速で進歩できるからです。ほとんどの場合、オープンソースは普遍的に有益であり、それが科学の仕組みです。

ただし例外もあり、それは AGI や強力な AI などの二重目的テクノロジーの場合です。

問題は、すべての無害なユースケースを有効にできるようにしたいこと、そして本物の科学者や技術者がこれらのアイデアを構築し、批判して社会の急速な進歩を推進できるようにしたいことです。しかし同時に、これらのシステムを悪用する可能性のある悪者をどのように制限するか、それが問題です。

これらのシステムが十分強力であるとは思わないので、今は問題ありませんが、2 ～ 3 年後、特にエージェント的な動作を持つシステムを入手し始めた場合、深刻な害を引き起こす可能性があります。

当社には Gemma と呼ばれる独自のオープンソース Gemini モデルがありますが、これらは小規模なモデルであり、最先端のモデルではありません。

これらの機能はラップトップで実行でき、パラメーターの数が少ないため、開発者にとって依然として非常に役立ちます。これらは最新の最先端モデルではないため、現段階ではその機能は十分に理解されています。

おそらく最終的にはオープンソースモデルを用意することになるでしょうが、ユーザーとの公開テストでこれらのモデルの機能を実際に評価できるようにするには、最新の最先端モデルより 1 年ほど遅れることになります。

オープンソースの問題の 1 つは、何か問題が発生した場合にそれを思い出せないことです。独自のモデルを使用すると、悪者が悪用し始めた場合にシャットダウンすることができ、極端な場合にはシステム全体をシャットダウンすることもできます。しかし、一度何かをオープンソース化すると、それを元に戻すことはできません。

AGIは10年以内に利用可能になる予定

質問：現在、科学研究者によってさまざまなAIモデルが開発されていますが、AIがすべての科学研究をサポートする段階に入ったとしても、研究開発機関が存在する余地はあるのでしょうか？

ハサビス：まだ余地はあると思いますが、これには社会、学界、政府、産業界の緊密な連携が必要だと思います。

これが最終的にそこに到達する唯一の方法であると私は心から信じています。 AGI の後に何が起こるかについて尋ねているのであれば、それがおそらくあなたが本当に知りたいことです。 AGI は、私が常に構築したいと熱望してきたものです。AGI を使用すると、現実、物理学、意識などの性質に関する最も基本的な疑問のいくつかを調査できるからです。

質問: コンピューター科学者のスチュアート・ラッセルはかつて私に、「AGI に到達したら、私たちは皆、過去の貴族のように、何の目標も考えずに気ままで贅沢な生活だけを楽しんでいるのではないかと少し心配している」と語ったことがあります。

ハサビス：今後の展開は非常に面白いものになると思います。しかし、それは、短期的な誇大広告と長期的な誇大広告の違いである、先ほど述べた「過小評価」の問題にも関わってきます。それを誇大広告と呼びたいのであれば、それは確かにある程度過小評価されています。

今後の変化は大きいと思います。最終的にはできると信じています多くの病気、さらにはすべての病気を治し、エネルギー問題や気候問題を解決します。

質問: そういえば、AGI が宇宙の謎を探求できることを期待しているとおっしゃっていたのを思い出しますが、ワームホールのような現象など、私たちがまだ想像していない可能性があると思いますか。

ハサビス：確かに、私はこの可能性を完全に信じています。ワームホールが現実になることを心から願っています。物理学と現実の本質について、私たちはまだ多くの誤解を持っているように思えます。

明らかに、量子力学と重力の統合、標準模型の問題、超弦理論などには、数え切れないほどの未解決の謎が隠されています。私は物理学コミュニティの多くの友人と徹底的に議論しましたが、彼らは皆、既存の理論的枠組みには完全に適合しないものがたくさんあると信じています。

私は個人的に多元宇宙の説明はあまり好きではないので、新しい理論を考え出し、それを宇宙の大型装置で検証できたら素晴らしいだろうと思っています。

私がプランクの時間と空間のスケールにこれほど魅了される理由は、それがすべてを分割できる最小単位のような、現実の究極の解像度を表しているように見えるからです。

したがって、特に問題がある場合には、このレベルで徹底的な実験的探査を行う必要があると思います。AGI と豊富なリソースがあれば、おそらくそのような実験装置を設計または構築できるでしょう。

質問: DeepMind は 20 年にわたるプロジェクトだとおっしゃっていましたが、現在はどこまで進んでいますか?まだ計画通りに進んでいますか？

ハサビス: はい、まだスケジュール通りに進んでいます。通常、20 年前のプロジェクトは完了までにさらに 20 年かかるように感じられるため、信じられないことに聞こえるかもしれません。しかし、私たちは長い道のりを歩んできました。

私たちの目標は 2030 年までにそれを達成することなので、今後 10 年以内に達成できても驚かないでしょう。

動画アドレス：https://www.youtube.com/watch?v=pZybROKrj2Q ※

ニュース