ニュース

設立から1年で評価額は100億を超え、セコイアとソフトバンクが出資を争っている この人型ロボット企業は一体何をしてきたのだろうか。

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


ロボット業界の「GPT-3」の瞬間はすでに起こっていますか?


著者 | シンシン
編集| ジンユ

身体化された知能、つまり人型ロボットは現在、AI に次いで最も人気のある投資プロジェクトとなっています。 OpenAI、Nvidia、Microsoft のいずれも、人型ロボット チームに多額の投資を行っています。

今、シード選手が巨人からの支持を得ている。

最近、Skild AI という会社が 3 億米ドルのシリーズ A 資金調達の完了を発表しました。投資家にはジェフ・ベゾス、日本のソフトバンクグループ、セコイア・キャピタル、カーネギーメロン大学などが名を連ねており、同社の評価額は15億ドルとなっている。

この会社は設立されてから 1 年足らずで、ロボット工学分野の 2 人の大学教授によって設立され、そのチームはさまざまなタイプのロボットやさまざまな現実のアプリケーションのための普遍的な「頭脳」として「スケーラブルな基本ロボット モデル」を構築しています。ロボット ハードウェアに後付けできるシステムも構築します。

「当社の長期的な目標は、物理世界に基づいた汎用人工知能(AGI)を開発し、AGIはデジタル知識からのみ生まれ得るという一般的な概念に挑戦することです」と同社は述べた。

投資家はロボット業界に「GPT-3の瞬間が来る」と信じて、すぐにこれに資金を注ぎ込んだ。

Skild AI は何を正しく行ったのでしょうか? AI + 身体化知能の野望を実現できるでしょうか?

01

「ロボット大型模型」

Skild AI は、カーネギーメロン大学のディーパック・パタック教授とアビナブ・グプタ教授によって 2023 年 5 月に設立され、物理世界に基づいたインテリジェント システムを開発し、「ロボットの頭脳」と理解できるロボットの基本モデルを構築しています。

彼らが作っているものの何がそんなに特別なのでしょうか?従来のロボット技術は、特定のデータを収集して特定のタスクを完了するようにロボットを訓練することに重点を置いていますが、Deepak 氏と Abhinav 氏が作成したいのは、大規模なデータを使用して、Transformer に基づく適応アーキテクチャを通じて基本モデルを構築することです。創発的な行動のモデル。

同社はこう言いました。同社のトレーニングモデルのデータ量は「競合他社のモデルの1000倍以上」で、ロボットデータの壁を突破している。 。特定の用途に合わせて垂直に設計されたロボットとは異なり、Skild のモデルは、操作、移動、ナビゲーションなどの機能をカバーし、さまざまなロボットの形態、シナリオ、タスクの「汎用」頭脳として機能します。

同社のモデルは、過酷な物理環境にも耐える「四足ロボット」から、家庭や産業の複雑な作業を実行できる「人型ロボット」に至るまで、現実世界のアプリケーションで役立つと言われている。

したがって、理論的には、この「ロボットの頭脳」は、ボストン・ダイナミクスの四足ロボット「スポット」やアジリティ・ロボティクスの人型ロボット「ディジット」に「電力」を提供する可能性があるが、同社はまだ具体的なパートナーを発表していない。


「ユニバーサル」ロボット基本モデルの構築|画像出典:Skild AI

Skild AI は、その使命を「生産性を向上させ、人間の可能性を解き放つように設計された、初の真にインテリジェントな物理システムを開発することによって、物理的な仕事の未来に革命を起こすことである」と述べ、ビジョンは「物理に根ざした汎用人工知能 (AGI) を構築する」ことであると述べています。世界。 "。

世界中の多くの人がAIやロボットに仕事を奪われることを懸念しているが、ロボットを製造する企業は概して、いわゆる「労働力不足問題」を解決したい、あるいはもっと野心的には「人類の解放」をしたいと好んで言う。

Skild AI も例外ではないようです。

彼らが対外的に強調しているのは、例えば米国は現在深刻な労働力不足に直面しており、失業者の数よりも170万人も多くの空き職が存在しているということだ。医療、建設、倉庫、製造などの業界は最も影響を受けており、2030年までに210万人の製造業の雇用が失われると予想されている。

さらに、石油掘削装置や機械室など、これらの仕事の多くは人間にとって危険を伴う可能性があります。 Skild のモデルを使用すると、危険な環境で人間にタスクを実行させるのではなく、ロボットが新しいタスクを実行するように適応できるようになります。

Skild AI の共同創設者、アビナブ グプタ氏は次のように述べています。「ユニバーサル ロボットは、あらゆる環境であらゆる実装方法であらゆる自動化タスクを安全に実行でき、ロボットの機能を拡張し、コストを削減し、深刻な労働力不足をサポートできます。市場。"


Skild AI は、脳はさまざまなハードウェアとタスクに適応できると述べています | Skild AI

ロボット業界の人々は「ロボットは難しい」とよく言いますが、それはほぼこの分野を支配する名もなき自然法則の 1 つとなっています。

さらに、多くの人はロボットはハードウェアの問題だと考えていますが、Skild AI の創設者はそれがソフトウェアの問題であると考えています。

Skild AI は「スケールが重要」であることを強調し、最先端の機械学習アルゴリズムを開発していると述べ、「スケールの力を活用して、あらゆる環境で比類のない堅牢性を提供することに重点を置いています。建設現場から工場、家庭に至るまで、Skild Brain は次のことができます。」人間と同じように、構造化されていない環境に適応します。」

この「Skild Brain」、いわゆる頭脳は、さまざまなハードウェアやタスクに適応でき、「モデル設計が堅牢」な「初のスケーラブルな」基本的なロボットモデルであると言われています。

同社はまた、Skild Brain を活用した Skild AI モバイル制御プラットフォームを公開し、このプラットフォーム上で「ロボット用の高度な AI アルゴリズムとアプリケーションを開発」できるようにしたいと考えています。現在、このプラットフォームはオープンしておらず、興味のある開発者のみが登録して早期アクセス待機リストに参加することができます。

さらに、同社はセキュリティ/検査ロボットプラットフォームを立ち上げ、目視検査、データ収集、パトロールタスクを自動化するためのソリューションを提供するとしている。


Skild AI創業チーム|画像出典:Skild AI

今年7月、Skild AIは、Lightspeed Venture、Coatue、SoftBank Group、Jeff Bezos(Bezos Expeditions経由)、Felicis Ventures、Sequoia Capital、Menlo Ventures、General Catalyst、CRVが主導する3億米ドルのシリーズA資金調達の完了を発表した。 、アマゾン、SVエンジェル、カーネギーメロン大学がラウンドに参加した。この資金調達により、会社の価値は15億ドルと評価されます。

Skild AIは、新たな資金をAIモデルの改善と商用展開の追求に使用すると述べた。長期的な目標は、「人間と同じ能力を持ち」、「物理世界に根ざした」AGIを作成することです。

CEO兼共同創設者のディーパック・パタック氏は、「Skild AIはロボット工学のスケールアップにおけるターニングポイントであり、実体経済全体を変革する可能性を秘めていると我々は信じている」と述べた。

02

インドのロボット偉大な起業家精神

同社のウェブサイトによると、Skild AIは複数のエンジニアリング職を募集している。現在のチームには、Meta、Tesla、Nvidia、Amazon、Google 出身のメンバーに加え、カーネギー メロン大学の学生が含まれています。

2 人の共同創設者であるディーパック氏とアビナフ氏は、どちらもカーネギー メロン大学の教授であり、ロボット工学と AI の分野で長年の研究経験を持っています。彼らは、自己監視型ロボット工学、好奇心主導のエージェント、およびロボット工学に関する専門知識で知られています。適応ロボット学習分野の研究で知られています。

彼らの学術レベルを数値化したい場合、彼ら 2 人は現在、H インデックスが 150 以上で、引用数が 90,000 を超えています。


Skild AI の共同創設者である Deepak (左) と Abhinav (右) 画像出典: Skild AI |

ディーパックさんはインドの小さな町の出身ですが、同僚が国家試験の準備のために大都市に引っ越しても、彼は小さな町に留まり、インドの最高位の高等教育機関であるインド工科大学(ITT)に入学しました。この成果は今でも地元の見出しになっています。

インド滞在時も条件が整わず、自宅で紙に手書きでコードを書いてチェックし、限られたインターネット時間の中で書いたプログラムを現地のカフェで実行したという。その後、このインドの「小さな町の伝説」は博士号を取得するために米国に渡り、その間 Facebook AI Research Institute (FAIR) に参加して研究を行い、また新興企業を設立しましたが、買収されました。 、その後教授になることを選びました。

アビナフはカーネギーメロン大学の終身教授であり、彼とディーパックはインド出身であり、FAIR ロボット研究グループの創設メンバーであり研究リーダーでした。 。彼とディーパックは、起業の可能性について 10 年間話し合いました。 2023 年初頭、彼らは自分たちの分野における技術進歩の加速を目の当たりにし、世に出て大きな話題を起こす時期が来たと認識しました。

では、彼らが見ているチャンスとは具体的に何でしょうか?ロボットの汎用知能の構築を追求する上で、重要な課題は、大規模なデータを使用せずに大規模なモデルを構築する方法でした。

大規模な言語モデルとは異なり、ロボット工学の分野ではすぐに利用できるインターネット データはありません。そこで彼らは、オンラインビデオ、遠隔操作、実世界のデータ、シミュレーションなどの既存のリソースから学習するためのさまざまな戦略を検討しました。

2015 年に初めてロボット データの 1,000 倍の拡張を達成し、その後数年間、人間の遠隔操作と低コストのロボットの遠隔操作プラットフォームを実験しました。 2017 年に、彼らは自律的に探索および学習できるエージェントを構築するための有名な好奇心主導型学習アルゴリズムを提案しました。 2021 年と 2022 年には、大規模適応型 SIM2REAL (仮想現実世界トレーニング) 戦略を採用して再び躍進し、ロボット学習カンファレンスで最優秀ロボット システム賞を受賞しました。

これらの成果により、Skild AI の目標、つまり、特定のトレーニングを必要とせずに、あらゆる環境であらゆるタスクを完了できる汎用モデルが確立されました。一部の投資家は、ディーパック氏とアビナフ氏がこの目標を達成できれば、GPT-3と同様のブレークスルーを達成し、その結果はほぼすべての分野に適用できるかもしれないと信じている。

03

ロボットの

「GPT-3の瞬間」?

カーネギーメロン大学ロボット工学研究所の現所長であるマシュー・ロバーソン氏は、彼らのプラットフォームを支持し、「Skild AIは、ロボット工学革新の最前線にいる専門家によって設立されました。彼らの最先端技術がどのように革命を起こすのかを目の当たりにするのが待ちきれません」と述べた。業界と...カーネギーメロンのトランスレーショナルリサーチの長い歴史を継続します。」

他の投資家も客引きに躊躇せず、Skild AIの能力と見通しに自信を持っているようだ。そのほとんどは、世界の先進的なロボット工学および AI 研究所に対する 2 人の創設者の貢献に焦点を当てています。

ここ数年、インターネットは時折、極端なパルクールを実行したり、手で物体を操作したり(ドアや引き出しを開けるなど)、階段を上ったり(前後、屋内または屋外)、自然かつスムーズに移動したりするロボットによって騒がれてきました。進歩は、二人の学問的業績の一部に遡ると言われています。

一部の投資家は彼らをロボット工学の進歩の「触媒」と呼び、「基本モデルの中核原理を現実世界に適用する彼らのイノベーションが業界をユニバーサルロボット工学への道に導いた」と信じている。

一部の投資家は、Skild AI はロボットの操作と動作の基本モデルを構築する際に「真にスケーラブルなアプローチを採用している」と指摘し、「彼らはロボット技術に革命をもたらし、事前にプログラムされたロボットから動的適応ロボットに移行しました。これは社会全体を覆す可能性があります。」実体経済だ。」

別の投資家は15年以上ロボット企業に投資しており、Skildをこれまで見た中で「最も先見の明がある」と評し、「彼らが構築しているモデルは、どんな環境でもどんなハードウェアでもどんなタスクも実行できる」としている。

Felicis Ventures の投資家らによると、ユニバーサル ロボット インテリジェンスの開発競争は始まっており、これほど迅速に資本と人材を動員できるアイデアはありません。ユニバーサル ロボットの基本モデルは、このチェーンの重要なリンクとなるでしょう。

どのような環境でも、どのような形式でも推論、計画、行動できる「単一のモデル」を作成するというアイデアは、新しいものではありません。ロボット業界が常に目標としているのは、このアイデアの問題です。数年前にはそれはまったく不可能だったのですが、今ではそれが現実になる可能性があります」とフェリシス・ベンチャーズの投資家は語った。

「私たちが初めてピッツバーグに飛んで、Skild ロボットが動作しているのを見たとき、スタートアップがどうしてこれほど短期間でこれほど多くのことを達成できるのか、信じられませんでした。」

答えは規模にあります。大規模な事前トレーニング済み視覚言語アクション モデル (VLA) は、代数で LLM をトレーニングするとスペイン語でのパフォーマンスが向上するため、大規模な事前トレーニング済み言語モデル (LLM) と同じ創発的な動作を示します。 。 投資家の Felicis Ventures は、「Skild はこのコンセプトを極限まで推し進めている」と信じています。

Skild 氏が行っており、達成したいと考えているのは、いわゆる千倍のトレーニング データを使用して、ロボットがこれまで見たことのないタスクを実行できるようにすることです。

Sequoia Capital の投資家らも、Skild AI のチームを「深く信じている」と述べ、「OpenAI がデジタル世界で達成したことを現実世界でも達成できる可能性がある」と述べた。

信仰の証拠の一つは、すぐにお金を与えることです。創設者に会ってから 1 週間も経たないうちに、Sequoia Capital は Skild AI への投資を決定し、このチームが彼らが追求しているものであると信じ、「GPT-3 の瞬間が来ており、世界に大きな変化をもたらすでしょう」と述べました。ロボットは、私たちが現在いるのと同じように、デジタルインテリジェンスの世界で見られるのと同じ進歩を遂げています。」

これらの投資家は、AI が人間の生活に及ぼす影響についての議論は非常に活発であるものの、これまでのところ、多くの議論は依然として主にソフトウェアに焦点を当てており、AI をロボットに統合することには、単に可能性があるだけではなく、大きなチャンスが隠されていると考えています。デジタル知識を構築することで達成されます。まだ初期段階ではありますが、ロボット メーカーには、LLM、VLM、コード生成の進歩を利用して、よりスマートなマシンを開発する機会があります。

「基本的な AI ロボット モデルが、あらゆる環境、あらゆるロボット ハードウェアであらゆるタスクを完了できる世界を想像してください。これにより、構築できるロボットの種類が大幅に拡大され、コストは現在よりも桁違いに低くなるでしょう。」

ソフトウェアの世界で AI が巨大企業のゲームになるにつれて、AI をロボットに統合する可能性と魅力が明らかになります。

AI のホットマネーの波はロボット工学の分野にも向けられています。

※ヘッド画像出典:Skild AI

この記事は Geek Park によるオリジナル記事です。転載については、WeChat geekparkGO の Geek Jun までご連絡ください。

オタクが尋ねた

AI + 身体化された知能についてどう思いますか?


マスク: 過去 7 か月間で 2 人が私を暗殺しようとしました。

いいねとフォローGeek Park ビデオ アカウント