ニュース

Googleのロボット工学専門家「AIもロボットが現実で遭遇したのと同じ壁にぶち当たるだろう」

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


マシンハートレポート

編集者:張騫

「機械学習は、ロボット工学者、化学者、生物学者、神経科学者の羨望の的であるバブルの中で生きてきました。そして、それが本格的に軌道に乗り始めると、私たち全員が、他の誰もが何年も対処してきたのと同じ問題に遭遇することになるでしょう」現実的な障壁。」

ロボット工学の分野の進歩は、機械学習の他の下位分野に比べて遅い、あるいは進歩がないとさえ言う人もいます。

Google DeepMind のロボット科学者であり、SayCan、RT-1、RT-2 などの身体化インテリジェンス プロジェクトに参加している Alex Irpan 氏もこれに同意します。しかし、それはロボット工学が現実と密接に関係している分野であり、現実の複雑さによって必ず壁にぶつかるからだと彼は考えています。同氏はまた、こうした問題はロボット工学に特有のものではないとも指摘した。同じ問題が大規模言語モデル (LLM) などの技術にも当てはまります。これらのモデルは、現実世界に直面すると、ロボット工学と同様の複雑さに直面します。

最近、彼はこの点を説明するために「現実の悲劇があなたにやってくる」というタイトルのブログを書きました。



現実の悲劇があなたにやってくる

2023 年、私は ML カンファレンスに参加しました。 Ye Weiyang が酔っ払っていたため、話題は「機械学習のサブフィールドのリソースを別のサブフィールドに渡すことができるとしたら、どのサブフィールドを切り捨て、誰にリソースを渡しますか?」という質問になりました。

誰が何を言ったか覚えていないが、ある人がロボットを切り倒すつもりだと言いました。さらに問い詰めると、ロボット工学の進歩は遅すぎるし、他の分野に比べて何も起こっていない、とのことだった。

ロボット工学は機械学習の純粋なソフトウェア分野に比べて進歩が遅いと言われており、私もその通りだと思いますが、さらに 2 つの点を付け加えたいと思います。

  • ロボットの学習が遅い理由は、難しい問題を解決しないと違いを生み出すことが難しいためです。
  • ロボット工学の課題はロボットに特有のものではありません。

ロボット工学の分野ではよく「現実は厄介だ」と言われます。コードに関連して、私はこれを「現実は複雑である」に拡張します。ロボット工学では、乱雑な現実を、コードがその上で動作できる十分な抽象レベルまで押し上げる傾向があります。コンピュータ サイエンスは分野として、ハードウェアとソフトウェアの間に優れた抽象化レイヤーを作成するのに数十年を費やしてきました。コードには、ハード ドライブ、プロセッサ、ディスプレイに電力を供給する方法が記述されており、それについて考える必要がないほど信頼性があります。



これを行うと多くの利点があります。大変な作業を終えて、作業の進行状況を抽象的な論理空間に移すと、すべてが簡単になります。コードとデータは信じられないほど再現性があります。私は何も考えずに、このブログ投稿の下書きを表すファイルのコピーを 3 台のデバイス間で同期しました。

しかし、ジョエル・スポルスキーが言ったように、すべての抽象化にはある程度の穴があり、ロボット工学の穴はさらに大きい傾向にあることがわかりました。コードの正確さとは関係なく、さまざまな問題が発生する可能性があります。

これはこの主題の基本原則と関係があるのでしょうか?少し。ロボット ハードウェアの多くは、ラップトップや Linux サーバーよりも実験的なものです。消費者向けロボットはまだ大きな産業ではありません。 「実験的」とは、多くの場合、「奇妙な、より失敗しやすい状態」を意味します。

ただし、ハードウェアが問題の主な原因ではないと思います。現実が問題の根源です。 ベンジャミン・ホルソンは、「神話上の非ロボット主義者」という記事でこのことを非常にうまく述べています。

最初の困難は、ロボットが現実世界での不完全な認識と不完全な実行に対処しなければならないことです。グローバルに変更可能な状態は、対処するのが非常に難しいため、悪いプログラミング スタイルです。しかし、ロボット ソフトウェアの場合、物理世界全体がグローバルに変更可能な状態であり、それを信頼性の低い状態で観察し、アクションによって達成したいものに近づくことを期待することしかできません。

ロボット研究は現実とソフトウェアの間に新しい橋を架けることに依存していますが、これはロボット研究の外でも行われます。現実とインターフェースするソフトウェアは、現実を不完全に理解しています。現実世界の変化に影響を与えようとするソフトウェアは、世界的に変わりやすい現実の状態に対処する必要があります。現実に起こっていることに動作が依存するソフトウェアは、敵対的なノイズと複雑さを招きます。

ゲームAIが良い例です。チェスAIは超人的に信頼できる。ただし、Tony T. Wang らが ICML 2023 論文「Adversarial Policies Beat Superhuman Go AIs」で発見したように、一部の超人的な囲碁 AI は特定の方法でチェスをプレイすると勝つことができます。敵対的テクニックは、人間が再現できるほど明確な戦略を見つけます。

付録 G.2 では、著者の 1 人である囲碁専門家が、アルゴリズムの助けを借りずに相手の棋譜を学習することで、この [周期的] 攻撃を実装することができました。彼らは、KGS オンライン囲碁サーバー上で標準的な人間の条件下で対局し、作者とは関係のないトップ KataGo ロボット ゲームで 90% 以上の勝率を達成しました。
著者は、ロボットに 9 つのハンディキャップを与えることで勝利することさえできました。これは大きな利点です。これらのハンディキャップを持つ人間のプロのチェス プレーヤーは、人間または AI のどの相手に対してもほぼ 100% の勝率を持つことになります。また、KataGo と Leela Zero も打ち負かしました。どちらも、ゲームごとに 100,000 件の検索を実行しましたが、これは一般に人間の能力をはるかに超えています。それ以来、他の人間が周期攻撃を使用して、他のさまざまなトップ囲碁 AI を倒してきました。

一方、数年前、OpenAI は Dota 2 の現世界チャンピオンを破るシステムを作成しました。システムの堅牢性をテストするためにシステムを一般に公開した後、あるチームは 10 連勝につながる戦略を考案しました。



これに基づいて、19 x 19 の碁盤や Dota 2 を接続するような単純な「現実」でさえ、堅牢な動作を困難にする十分な複雑さが追加されているという悲観的な見方をするかもしれません。どちらのシステムも堅牢性が最高の目標ではないため、この見方は不公平だと思いますが、興味深いケーススタディだと思います。

最近、LLM について、何ができるのか、どこに応用できるのか、という誇大宣伝の波が押し寄せています。この中には、LLM が仕事や余暇における人々のテクノロジーとの関わり方を劇的に変えることができるという信念が含まれています。言い換えれば、LLM は私たちが現実と対話する方法を変えるでしょう。実際、私は誇大宣伝の流行に便乗してきました。具体的には、基礎となるモデルが短期的には過剰に宣伝され、長期的には過小評価されているのではないかという疑念を抱いています。しかし、それはまた、歴史的に現実を考慮するのが苦手だったこの分野にとって、現実のあらゆる混乱が訪れることを意味する。

この男がロボット工学は資源の無駄だと言ったのと同じ ML カンファレンスで、私は実際のロボットを使って基本的なモデルの実験を行っていると言いました。少し怖そうだと言う人もいましたが、私はそれが単なる研究プロトタイプであることを保証しました。しかし、私は LLM の生成および実行ソフトウェアを少し怖く感じます。彼らが一方については漠然と心配しているのに、もう一方については心配していないのは興味深いと思います。シリコンバレーの人々は少し矛盾しています。彼らは、ソフトウェアが新興企業を力づけて驚くべき変化を達成できると信じているが、自社のソフトウェアは考えたり熟考するに値しないと信じている。私はビットの世界もアトムの世界と同じくらい現実の一部であると信じています。それらはさまざまなレベルで機能しますが、すべて現実の一部です。

私は、LLM 実践者がロボット工学が以前に遭遇したのと同じ問題点に遭遇し始めていることに (シャーデンフロイデとともに) 気づきました。たとえば、「コストが高すぎるため、これらのトレーニングを再現することはできません。」はい、この問題はロボット工学の分野で少なくとも 10 年にわたって議論されてきました。別の例: 「Bing に『アバター 2』のリリース日を教えてもらうことができません。なぜなら、Bing はそれ自体に関するニュースレポートを引っ張り出し、生成する前に自ら修正し続けるからです。」

私たちは現在、インターネット上で公開されているテキストが検索拡張の生成に取り消し不能な影響を与える世界に住んでいます。グローバルな可変状態へようこそ。 ChatGPT の動作が退化したと主張する人を見るたびに、ロボットのパフォーマンスの突然の不可解な低下と、問題がモデルにあるのか環境にあるのかを説明するために私や他の人が考え出したさまざまな「陰謀論」を思い出します。それとも私たちの思い込みでしょうか。

「すべてのロボットのデモは嘘をつく」ということわざがあるように、LLM のデモもすべて嘘をついていることに人々は気づきます。人間の集中力には限界があるので、基本的にはこれは仕方のないことだと思います。嘘の種類、規模、重要性を評価することが重要です。モデル/ボットがどのように一般化されるかを示していますか?これらの例がどれほど慎重に選ばれたかについて彼らは言及しましたか?現実が結びつくと、これらの問題はさらに複雑になります。メッシは現時点では優れた選手のように見えるが、「ストーク・シティの寒い雨の夜にそれができるだろうか」

問題を複雑にしているのは、これらの質問に対する答えが常に「ノー」であるとは限らないことです。メッシならストーク・シティの寒い雨の夜でもそれができるだろう。彼は十分上手だ。正しく「いいえ」と答えるよりも、正しく「はい」と答えることがはるかに重要であるため、このことが質問を難しくしています。 LLM がますます改良され、AI が日常生活でより一般的になるにつれて、社会として、モデルがそれ自体を証明したかどうかを判断する能力がますます向上する必要があります。将来に関する私の主な懸念の 1 つは、モデルがそれ自体を証明したかどうかを評価するのが苦手であるということです。

しかし、私はロボット工学者が時代の先を行くことを期待しています。 LLM が一般的なベンチマークを操作しているという提案が浮上する前、私たちは評価の問題について不満を述べていました。 「より良いデータ範囲が必要です」が基本モデルの事前トレーニング チームのスローガンになるずっと前から、私たちは自動運転のロングテール効果を捉えるのに十分なデータを取得するために懸命に取り組んでいました。機械学習は、ロボット工学者、化学者、生物学者、神経科学者の羨望の的であるバブルの中で生きてきましたが、本格的に軌道に乗り始めると、私たち全員が、他の誰もが何年も対処してきたのと同じ問題に遭遇することになります。現実的な障壁。これらの課題は克服できますが、困難になるでしょう。現実の世界へようこそ。痛みの世界へようこそ。

元のリンク: https://www.alexirpan.com/2024/07/08/tragedies-of-reality.html