ニュース

「身体化された知能」が世界ロボット会議を席巻、北京の王天妙教授:そのほとんどは実際には「身体化されたスキル」である

2024-08-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

・現状、人型ロボットはまだ2つの大きな課題に直面している。まず、ロボットに適した一般的な大型モデルや垂直型のプロフェッショナルモデルなど、ロボットの「ソフトウェア」面がまだ難しい段階にある。技術とコストの面で必要な課題。
・現状、人型ロボットのコストはまだ顧客の要求に達していません。また、大量生産にはサプライチェーンの問題も伴います。現段階では、人型ロボットは主に、ハードウェアのオープン化など、科学研究プラットフォーム上でさまざまなアプリケーションを構築するために使用されています。私たちがソフトウェア開発アプリケーションと呼ぶものまでには、まだ長い道のりがあります。
2024年の世界ロボット会議で「身体化された知能」が激しい議論の焦点となったとき、北京大学ロボット工学研究所の教授兼博士指導者であり名誉所長である王天妙氏は、別の視点を提唱した。彼は、この展覧会で展示されているもののほとんどは、垂直分野で具体化されたスキルであると信じています。現段階では、身体化された知能ロボットや人型ロボットについては、業界は基本的に一般分野の開拓に留まっています。
身体的インテリジェンスは、ロボットが包括的な認識、推論、自律的な意思決定を通じて、複雑な環境でマルチタスクと人間とコンピューターの相互作用を実現し、幅広い認知能力を備えていることを強調します。一方、身体的スキルは、シナリオにおける特殊な能力に重点を置いています。特定のタスクを効率的に完了できるように設計されており、アプリケーションをより垂直化し、商用化を容易にします。業界は、身体化されたインテリジェンスは「広範で包括的な」知能に焦点を当て、身体化されたスキルは「専門的で洗練された」能力に焦点を当てていると考えています。
現在、北航ロボット研究所の名誉所長であり、中関村智友研究所の所長でもある王天妙氏は、30年以上にわたりロボット産業に深く関わっている。 2020年、Wang Tianmiaoと15人の科学者は、身体化知能、ロボット、ロボットの上流コアコンポーネントの分野に焦点を当てた「スマートフレンズ科学者基金」を立ち上げた。
北杭ロボット研究所名誉所長、中関村スマートフレンズ研究所所長、王天妙氏
この会議では、人型ロボットの数が史上最高レベルに達しました。展示されている27台の人型ロボットは、柔軟に連携して動作する「腕」と「指」から、複雑な地形を歩く「足」、そして大型の人工知能モデルに基づいた「脳」の開発まで、さまざまな形をしています。王天苗氏は、この百輪の花が咲く現象は技術開発の初期段階では正常な現象であると信じている。現在、人型ロボットは依然として 2 つの大きな困難に直面しています。まず、ロボットに適した一般的な大型モデルや垂直型のプロフェッショナル モデルなど、ロボットの「ソフトウェア」面がまだ難しい段階にあります。技術とコストの面で克服する必要があります。
世界ロボット会議で展示された人型ロボットは多くの観客を魅了した。
8月23日、Wang TianmiaoはThe Paper (www.thepaper.cn)およびその他のメディアから、身体化された知性が現在直面している困難と課題についてのインタビューを受けました。
以下は、本紙による王天苗氏へのインタビューの内容である。
ロボットの「ソフト」な側面とその器用な手は、克服する必要がある難しい問題です。
ThePaper Technology: カンファレンス中、身体化されたインテリジェンスが業界で話題になりましたが、この身体化されたインテリジェンスのブームについてどう思いますか?
王天苗:現在、人型ロボットや身体性知能ロボットの開発を考えるとき、誰もが次の 3 つの疑問について考える必要があると思います。
まず、どのようなシナリオに適用されるかです。今後 3 ~ 5 年で、ロボットは複雑な環境に導入される可能性があり、安全性と機能性の点で効果的にテストされ、顧客の検査に合格する必要があります。これは現時点で非常に重要な問題です。危険な環境、産業、家庭、さらには一部の汎商業シナリオにおいても、テクノロジーは常に反復されています。
第 2 に、アプリケーションによって駆動されるという 2 つの点に特別な注意が必要です。第 1 に、ロボットの「ソフト」ソフトウェアは、大規模なモデルとデータによって駆動されて生成および学習されます。この具体化されたインテリジェンスの波で最も重要なことは、大規模なモデルがロボットに実現を可能にするということです。 2 つ目は、さまざまなサブタスクと現実の物理空間の組み合わせです。これには視覚モデルと触覚モデルが必要であり、触覚がなければ空間推論はできません。繊細な組み立てや操作さえも完了するのは困難です。
第三に、安定して安全に歩行できることはもちろん、手先が器用であることも重要です。 Figure AI の新製品も器用な手を重視しており、テスラもアプリケーションを更新するときに器用な手を組み込む予定です。
これら 3 つの問題は、私たちの身体化インテリジェンス研究の 3 つの焦点である可能性があり、ホットスポットでもあります。
現時点では「ソフト」面では、一般的な大型モデルや縦型プロフェッショナルモデルはまだクリティカルな段階にある。さらに、汎用ロボットの場合、車輪型ロボットであっても脚型ロボットであっても、最終的に動作し対話するのは手です。そのため、器用な手は現在、人型ロボットが克服する必要がある技術的およびコスト的な課題となっています。
今回の展示では、そのほとんどが垂直分野のスキルを体現したものであるというのが私の単純な理解です。現段階では基本的には一般分野の探索にとどまります。
現場にいた別の人型ロボットが器用な手を披露
ThePaper テクノロジー: 人型ロボットの研究開発の観点から、大型モデルはどのような技術的問題の解決に重点を置くことができますか?
王天苗:ヒューマノイド ロボットに対する大型モデルの主な貢献は、人間のようなインタラクション、推論、環境適応性を実現することです。ただし、理論的および技術的な課題はまだ残っています。人間の認知は階層的であり、概念的および論理的な認知、知覚、視覚、触覚、さらには手足の協調的な使用が含まれますが、これらの異なるレベル間の関係はまだ完全には解明されていません。さらに、教師あり学習、強化学習、エンドツーエンド学習、シミュレーション学習のいずれであっても、大規模モデルのアルゴリズムの選択はまだ検討中です。さらに、大規模モデルを学習させるためのデータ生成、特に実際の操作データの取得にも問題があります。
大型モデルは一般的なロボットや特定の作業での役割が期待されていますが、実際には依然として専門性と精度が必要なタスクが多くあります。誰もが大型モデルを通じて「オールラウンド」なロボットを開発したいと考えていますが、これは理想であり、最終的には科学研究と応用シナリオの組み合わせ、および機能、安全性、コストのバランスが必要になります。
現段階では、人型ロボットの量産は主に科学研究プラットフォームを目的としています。
ThePaper テクノロジー: なぜ人型でなければならないのですか?産業シナリオでは、専門化されたロボットも作業を行うことができます。ヒューマノイドと専門化されたロボットの間に代替の関係はありますか?
王天苗:技術や産業の発展段階から判断すると、人型ロボットと大型模型が新たなカテゴリーのロボットを形成する可能性があります。ヒューマノイド ロボットの応用にとって特に重要なシナリオは、少量のバッチと複数の品種では、大規模な自動化を実現することが困難であり、さらには特に危険なシナリオです。モーター駆動のセンシング、統合ジョイント、トランスミッションセンシング、データ生成とサービスなどにより、新たな応用シナリオや応用産業が促進される可能性があり、さらに、ヒューマノイドロボットを出発点として使用することで、ロボットの理論、技術、製品を新しい分野に押し上げる可能性があります。新しいステージ。
今後 20 年間の知能ロボットの分野における人型ロボットの割合については、現在 2 つの異なる見解があります。人型ロボットの市場シェアは 50% または 60% を超えるだろうという楽観的な見方もありますが、他の業界関係者は、人型ロボットが市場シェアの 20% または 30% を占めるにすぎないと考えています。これらはニーズの一部を解決するだけであるため、アーム、クローラ、ホイール、協働ロボットや並列ロボットなど、他のロボットでも多様なニーズに対応できます。
私は個人的に、人型ロボットの最終形態は、第一に基礎的な技術革新の度合いによって決まり、第二に、特定のアプリケーション シナリオと顧客のニーズ、つまり顧客がこのサービス費用と費用を支払う意思があるかどうかにも依存すると考えています。製品の機能。したがって、人型ロボットが機能するかどうかを絶対に想定すべきではありません。
ThePaper Technology:今年は10万元を切る比較的安価な人型ロボットも登場しているが、これは人型ロボットの量産前夜ということだろうか。
王天苗:現段階では、15万でも10万でもそれより安くても、主に科学研究プラットフォームでの展示が目的です。現時点では、人型ロボットに対する顧客のコスト要求はまだ閉ループを形成しておらず、量産にはサプライチェーンの問題も伴います。現段階では、主に科学研究プラットフォーム上に構築されており、ハードウェアのオープン化を含め、さまざまなアプリケーションが科学研究プラットフォーム上に構築されています。いわゆるソフトウェア開発アプリケーションまでには、まだ長い道のりがあります。
ThePaper Technology: 現在、各社の人型ロボットの形状は異なります。たとえば、3 本の指を持つもの、5 本の指を持つもの、脚があるもの、まったく脚がないものもあります。次に、人型ロボットの形状は統一されるのでしょうか?
王天苗:破壊的なテクノロジーが登場すると、誰もが大きな期待を抱きます。そのため、頭を180度回転させたり、腰や手を自由に回転させたりするロボットも登場します。 1970 年代初頭の日本では、200 社近くの企業がさまざまなロボットの応用を試み、それが今日の関節や平行構造などに発展しました。現在の状況はごく普通のことであり、テクノロジーは今後も発展していくはずだと思います。しかし、将来的には、いくつかの標準化されたカテゴリが確実に形成されるでしょう。なぜなら、これらのカテゴリが効率、稼働時間、コストなどの点で最高の結果を達成し、サプライチェーンも徐々に形成されるからです。
ただし、これにはプロセスが必要です。現時点では10年かかるかも知れません。なぜなら、人型ロボットの開発において、一般的な人工知能が現実となり、物理世界と接触するには、これが唯一の方法だと思うからです。自動車や携帯電話、ロボットの開発など、科学技術の開発には長い時間とコストがかかります。
多くの人は過度に楽観的で、過度に熱心で、将来の破壊的な発展について誇張することがよくあります。しかし、現実はそうではありません。最終的には、その技術が本当に必要かどうか、機能が充実しているかどうか、社会保障が含まれているかどうか、コストが許容できるかどうか、そして産業化基準が健全であるかどうかによって決まります。は一連の総合的な考慮事項です。
多くの人は、あたかも翌日か来年には破壊的な進歩が達成されるかのように、テクノロジーが急速に進歩することを期待していますが、これは現実的ではありません。
特殊な新規中小企業に特化し、具体的なスキルから始めることをお勧めします
論文: あなたは科学研究と学術界、さらには産業の研究の経歴をお持ちですが、ロボット産業の発展において解決する必要がある問題は何だと思いますか?
王天苗:一般的に言えば、科学者は一般的な大型モデルに焦点を当てるなど、基礎研究や一般理論にもっと取り組むべきです。身体化されたインテリジェンスまたは身体化されたスキルについては、業界はアプリケーション分野と対応するサプライチェーン、使用の安全性、有効性、コストから検証する必要があります。
しかし現在、科学技術イノベーションと産業発展においては、基礎研究と工業・工学研究がますます密接に結びついている現象が見られます。期間が短縮されるだけでなく、この 3 つはお互いを促進し、刺激し合い、お互いのアプリケーションを促進します。その過程で、大学と企業が連携して基礎研究を行ったり、産業界や企業が大学と連携して応用技術の研究を行ったりする現象が見られました。技術革新と産業発展の結びつきはますます密接になり、そのタイムサイクルは私たちが想像していたように段階的に発展することができなくなりつつあります。
論文: スタートアップ企業にとって、特定のシナリオに基づいた比較的実用的なロボットのモデルを見つけるのが良いでしょうか、それとも比較的完成度の高い汎用の大型モデルに焦点を当てた方が良いでしょうか?
王天苗:新しいテクノロジーを専門とする中小企業の場合は、特定のアプリケーションに焦点を当て、具体的なスキルから始めることをお勧めします。これは、トレーニング データや大企業からの財政的支援を含めて、顧客に認識される可能性が高くなります。資金が豊富で、サポートするための産業背景リソースさえ持っている企業の場合、より一般的で一般的な道を選択する可能性があります。ただし、それは後の段階で実装する必要があります。
新興企業にとって、新種の形態の潜在的な応用は緊急に必要とされており、規模に関係なく探索する価値があります。第二に、手足のセンサー、脳(身体化された知能)、および脳の機能を含む上流のコアコンポーネントのブレークスルーに注意を払う必要があります。小脳 (身体化されたスキル) 。
さらに、ヒューマノイドロボットは大型モデルと知覚モデルを組み合わせて、積み降ろし、研磨、輸送と清掃などのシナリオでプログラミングなしで問題を解決するなどのスキルを汎用化することができますか? 将来的には、大型モデルを使用して自動化することを目指しています。複雑なタスクを分解し、プログラミング不要を実現すると、アプリケーション シナリオに大きなスペースがもたらされます。
ザ・ペーパーの記者ユウ・ヤン
(この記事は The Paper からのものです。よりオリジナルの情報については、「The Paper」アプリをダウンロードしてください)
レポート/フィードバック