ニュース

90年代以降の北京大学の博士課程指導者、テスラから学ばず人型ロボットを開発

2024-08-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

米国は中国の模範ではない。

本文丨王宇通
編集者丨チェン・マンチー

今年5月、身長1.72メートルの新しい労働者グループが米国テキサス工場にやって来て、円筒形の4680バッテリーセルを移送テーブルから目の前の赤い箱に積み込む責任を負った。 。彼らはそれほど熟練しているわけではなく、遅くて不器用ですらあります。しかし、これらの労働者は、テスラが2022年に発売する人型ロボット、オプティマスであり、すべてが異なります。

テスラが公開したロボットのビデオには、「完璧な使用シナリオ」「急速な進歩」「失業の警告」など、感嘆の声から心配の声までさまざまなコメントが寄せられた。

王鶴氏はそうは思わないが、現段階ではオプティマスは「まだ研究段階」だと考えている。

Wang He 氏は 1992 年生まれで、現在は北京大学フロンティア コンピューティング研究センターの助教授および博士指導教員を務めており、スタンフォード大学で学士号と博士号を取得しました。コンピュータービジョン、ロボット工学、人工知能に関するトップカンファレンスである CVPR ICCV に参加しています。数十の論文が出版されるのを待っています。

王鶴氏は昨年5月以降、知能ロボット企業「銀河将軍」の操舵手として注目を集めた。今年6月、銀河将軍は7億元の資金調達で2024年のエンジェルラウンドの資金調達記録を破った。

ほとんどの企業は完全な人型ロボットを製造していますが、Wang He 氏は、現段階では脚は最適なソリューションではなく、コストが増加するだけだと考えています。 「人型ロボットの操作能力が十分に優れているというわけではありませんが、足が欠けているということです。従来のロボットアームでは操作できないタスクがまだたくさんあるということです。現場に着陸する際には手の方が価値があると王鶴氏は判断しました。」実際には検査や巡回などの十分な運動能力があれば、ロボット犬も車と同じことを行うことができます。

Galaxy Universal の Galbot はゴミを拾っています。脚はありませんが、折りたたみ式の 1 本脚 + 車輪付きのシャーシを備えています。

テスラとグーグルは、身体化された知能の開発において、十分なデータを取得することが困難であるが、データを収集するために「遠隔操作」を使用することを選択した。つまり、ロボットが学習する必要があるアクションを実行するために、実際の人間に何らかの収集装置を装着させることである。 Wang He 氏は、これは良い取引ではないと感じました。「Google は数十万個のデータを作成するのに 10 か月以上かかり、数千万ドルもかかりました。Galaxy Universal はすべてを「Sim2Real (シミュレーションから実機への移行)」で選択しました。 )」、つまり主に合成シミュレーション データに依存します。

米国の人型ロボット企業は多額の資金を持っており、大胆です。Wang He 氏の観察の 1 つは、そのため、米国では PMF (Product Market Fit、製品と市場の適合性) を厳密に求めることができなくなっているということです。お金があれば、すべてを一度にまとめて完了です。」ただし、実データの不足やハードウェアの不安定などの業界の問題はシナリオで解決する必要があるため、商用化は初日から検討する必要があると氏は考えています。

王鶴氏は、「テスラのやっていることを標準とみなすべきではない」とし、中国の新興企業が「米国に潤沢な資本がないまま他人の物語を伝え続けるなら、それは行き詰まりでしかない」と述べた。

王鶴氏はテスラに同意しておらず、業界の多くの人々もギャラクシーGMに同意していない。 Wang He 氏が興味を持っている Sim2Real を例に挙げると、多くの実践者は、シミュレートされた合成データと現実世界の間には自然な違いがあり、それがトレーニング効果に影響を与えると考えています。 Galaxy Universal の最初のロボット Gabot がリリースされた後、一部の反対派は「デモと実際のアプリケーションの間には大きなギャップがある」「つかみについてたくさんの論文を書いたが、最後の手は吸引だった」など「安心した」と述べました。カップ」

それよりも大きな問題は、今は人型ロボットを作るビジネスを始める時期ではないということだ。一部の投資家は、ハードウェア、材料、エネルギーなどの多くの技術がまだ成熟していないため、これらの企業は殉教者になると信じています。 Kaifu Lee氏は具現化されたインテリジェンスについて語り、「10年後に起こることには今は絶対に投資できない」とZhengeのパートナーであるDai Yusen氏は、具現化はまだBlackBerryの時代にあり、iPhoneには投資できないと語った。 。

ヒューマノイド ロボットと身体化された知能はまだ非常に初期段階にあり、これは AI、材料、エネルギー、機械制御の開発、製造、サプライ チェーン管理、顧客開発、そして最終的には、長いチェーンと複雑な技術スタックを備えた業界です。生き残る会社に欠点はない。

勝者を語るのは時期尚早ですが、このインタビューは、ある若い科学者が研究開始から 1 年後に見たものを記録しています。彼は現在、大企業はより多くのリソースを持っていますが、それが必ずしも正しいとは限らないと考えています。これがチャンスであると考えています。

身体化された知性と人間社会~の最大公約数

「その後」: あなたは 2016 年から、視覚モデル、自然言語モデル、ロボット操作モデルを組み合わせた、今日の身体化された知能を研究してきました。この数年間の研究開発から何が見えてきましたか?

Wang He: 私は博士課程の勉強をしていたときに、身体化された知能に取り組んでいました。当時は、この 3 つの別々の小さなモデルを組み合わせて、カテゴリ レベルのオブジェクトの姿勢推定 (ポーズ: ポーズ) を実現しました。オブジェクト (3 次元空間内の位置と姿勢、位置推定: オブジェクトの姿勢を見つける) は、実際には両手操作です。

中国に帰国後、ここで創業する前に、私は犬型ロボット「玉舟」の背中にアームを取り付け、一連の動作をさせてみました。しかし、コンピューティング、リソース、さらにはシステム全体の多くの側面でニーズを満たせないことがわかりました。

そのとき、ハードウェアを自分たちで作らないと、すべて他人に頼らざるを得なくなり、システム開発のイタレーションも限られてしまうと感じました。ロボット産業が存在しない場合、知能だけをやるのは難しい。

「後で」: その後、どのような変化が起こりましたか?なぜ2023年に起業しようと思ったのですか?

Wang He: 体現されたスマートな起業家精神が米国よりも早く中国で醸成され始めた主な理由は、ハードウェアとオントロジーの成熟です。

米国の製造業では、米国内での部品の供給が不完全で、多くのものを輸入しなければならず、ハードウェア エンジニアが不足しています。中国のハードウェア生産は、最も低コストで最高の信頼性を実現できます。たとえば、Yushu の人型ロボットは、半年で数人で構築できます。

しかし、オントロジーは単なる大きなおもちゃです。次のステップは、知性の面でどのように競争するかです。 2023 年までに、PaLM-E のような大規模な身体化されたマルチモーダル モデルが世界中に登場し、マルチモーダルな知覚と身体化された操作の間の火花が点火されます。この度起業を決意しました。

「その後」:なぜ人型ロボットを始めようと思ったのですか?身体化された知性の担い手は必ずしも人型であるとは限りません。

王和:犬、飛行機、車など、実にさまざまな形があります。しかし、あらゆる形態の中で、肉体化された知性と人間社会との最大公約数は「人間の形態」だけであり得る。

生産環境と生活環境全体が人間向けに設計されているため、ヒューマノイドは最も多くの作業を行うことができ、将来的には最も多くの作業を行い、最大の経済生産価値を持つことになります。ビジョンの観点からは、身体化された知能と人型ロボットは同一視することができます。

「遅刻」:多くの人は、体現された知性のための起業家的窓口はまだ到来しておらず、これらの企業は殉教者となり、ハードウェア、材料、エネルギーなどの多くのテクノロジーはまだ成熟していないと信じています。たとえば、Kai-fu Lee 氏が具現化されたインテリジェンスについて語ったとき、「10 年後に起こることには絶対に投資できない」と Zhenge のパートナーである Dai Yusen 氏は、具現化はまだ BlackBerry の時代にあると述べました。 iPhoneには投資できません。

王和:2019年に李海福氏に会ったとき、彼はさらに50年かかるだろうと言いましたが、今では50年から10年に加速しました。

携帯電話を身体化された知能の例えとして使うことはできません。機能電話からスマートフォンまで、テクノロジーは大きく変化しました。現在、身体化された知能の技術的な方向性は明確になっています。オントロジーは大きなモデルと統合され、汎用ロボットになります。 。

このとき、試合が早く終わるほど技術やデータが蓄積され、後半での差が広がっていきます。ロボットが現場に入ると、実際の現場のデータがロボットの知能を補完します。後発参入者が、すでに数万台のロボットを保有し、実際のデータを絶えず逆流しており、すでに現場で落とし穴を経験している企業を超えることは非常に困難です。

これと自動運転同様に、十分な数の車を販売することによってのみ十分なデータが得られ、そのデータを使用してアルゴリズムをより迅速に改善することができます。 GoogleとTeslaの戦いでは、十分な車を保有しているTeslaが勝利します。

身体化されたインテリジェンスは、自動車に匹敵する市場に成長する可能性を秘めています。これは、これまでの技術革新と同じ特徴を持っています。最初は遅く、徐々に専用ロボットに取って代わられますが、10,000 台の規模に達すると、伝統的な産業の置き換えが加速します。

「遅刻」: 一つの事実は、身体化されたインテリジェンス起業家精神のブームが、 チャットGPT そして大模型ブーム。しかし実際には、大規模なモデルは身体化された知能の問題のごく一部しか解決できないため、時期尚早であると考える人もいます。

Wang He: 身体化されたインテリジェンスは、ソフトウェア、ハードウェア、アルゴリズムの統合の産物です。現段階では、大規模モデルとの統合ポイントは、一般的な知覚と言語コミュニケーションであり、これによりインタラクションの問題が解決されます。たとえば、ドラッグストアに誰かが来て、気分が悪くなったらどの薬を飲めばいいですか?とロボットに尋ねます。人と会話できるのは、薬の名前と場所を知っているロボットだけです。

もう一つの組み合わせは、物体を掴む、置くなどの特定の操作を実行する際にも、ロボットが大規模なモデルに基づいてエンドツーエンドを実現することです(将来的には、ロボットの軌跡は感覚情報を入力した後に直接出力されます)。大きなモデルは全体的な計画において役割を果たします。

全体として、大型モデルは補助的なものとなっていますが、大型モデルと小型モデルを組み合わせることで万能ロボットが誕生する可能性があります。

「後期」:銀河の航路は、小さな立体ビジュアルモデル+大きな基本モデルで構成されています。

王鶴氏:人間にはシステム1とシステム2があるように、速い思考と遅い思考は小脳の能力であり、ロボットでは対話制御や器用な操作など小型のモデルで対応できるスキルです。 ; 後者は、脳の能力は、大規模なモデルを使用して問題を認識、理解、計画し、解決することです。

これは 3 層のシステムであり、最下層はハードウェア、中間層はさまざまなスキルを実行できる小型モデル、上部層はタスク計画を担当する基本的な大型モデルです。ロボットが命令を受け取った後、大きなモデルは中間層の小さなモデルを呼び出す役割を果たします。小さなモデルが実行された後、大きなモデルはその結果に基づいて次のステップを検討します。

足はそれほど重要ではありません。手が鍵です

「その後」: 業界のほとんどの企業は脚を備えたロボットを持っています。最初のロボットである Galbot は、車輪付きのシャーシと手を備えています。

Wang He: 最も本質的な質問は、あなたの製品が現場にどのような価値をもたらすことができるかということです。 Biped は交通問題を解決するだけで、運用能力はありません。したがって、パトロールや検査などの現場でのみ行うことができます。これは、従来の車や犬を使用していたのと質的には変わりません。

しかし、手は従来のロボットではできない柔軟な生産を行うことができ、労働集約型の産業では大まかな作業が多く、想像力豊かな空間やシナリオが多いため、下半身よりも上半身の方が重要です。

「レイト・レイター」:手を操作する能力と足の複雑な動きを実行する能力ではどちらが難しいですか?誰もが思い描く最終形態は完全な人間の姿であり、最初に始めた企業が運動能力を補いたいときに追いつかないでしょうか?

王和:今は両手で操作することが多いので、まずは「手」で現場に入り、足は交換可能な汎用の低コストの車輪付きシャーシを使って、まず製品化して実際のデータを取得します。

二本足の製品の問題は、現実のシナリオに実装できないことです。そのため、二本足の製品を扱う企業は持続可能な資金調達能力を追求する必要があり、今後 3 年間で大きな波が起こるでしょう。もちろん、脚の性能が向上し、価格も適正になった場合には脚の交換も行います。

「後で」: なぜ一緒にやるという選択肢がないのでしょうか?

王鶴: 人型ロボットの操作能力は十分ではありませんが、足が欠けているからです。従来のロボットアームでは処理できない仕事がまだたくさんあります。

実際の使用を考えると、二足歩行ロボットよりも車輪ロボットの方がコストや安定性がはるかに優れています。同じ高さの場合、2 本の脚の BOM (原材料費) は車輪付きシャーシの 10 倍になります。また、足元は転倒しやすく、転倒すると大破してしまいます。

現在の脚の技術的な問題はまだ克服する必要があり、両手用のシーンに大きく遅れをとっています。たとえば、何かが棚から床に落ちた場合、それを拾うためにかがんで拾うことができる脚付きの人型ロボットは世界中に存在しません。

「後」: しゃがむことは人間にとって非常に簡単ですが、なぜロボットにはできないのでしょうか?

王和氏: 最も難しいのは、プロセス全体を通して体のバランスを維持することです。脚のバランス能力にはいくつかの段階があります。最初のステップは歩くこと、そして次のステップは階段を登ることです。これはすでに多くの企業を悩ませています。 3番目のステップは前かがみになることです。次に、スクワットとスプリットスクワットがありますが、これは現在実験室では不可能です。

足の発達は手よりも遅れており、人間も同様で、赤ちゃんがハイハイしかできないときは、手はどこでも探索できますが、立ち上がって安定して歩くには時間がかかります。 6、7歳です。

実際、20年前には二足歩行のデモが行われていたが、今では実際に10分も平気で歩ける人は数えるほどしかいない。多くの二足歩行ロボットの安定性は、誰もが期待できるものではありません。身体化された知性の分野では、脳の発達は腕や手よりも先であり、腕や手は脚よりも先にあります。

「後期」:テスラの人型ロボットオプティマスは両手両足があり、工場で働くことができるようになった。

王和:オプティマスの現在の作業現場は、工場内でのバッテリーのキャッチや駐車場での行き帰りの検査など、足の能力を向上させる必要はありません。

計算するのは難しいです。ロボットのコストは数十万ドルから 20 万ドルですが、ロボットの仕事は、合計 30 個のグリッドを備えた 5 × 6 個の箱にまったく同じバッテリーを入れることです。標準電池を標準カゴに入れます。カゴの位置は固定されています。なぜこのようなことに身体化された知性が必要なのでしょうか?なぜ伝統的なものを使わないのか産業オートメーション

「後半」: ギャラクシーのガルボット将軍がメイトゥアンの薬局で薬を仕分ける これはロボット アームでも行うことができますが、人型の上半身を使用することもできます。

ワン・ヘ:私たちが体現した能力を示すためにこのシーンを作成しました。何かが難しすぎて、テクノロジーがまだこの段階まで発展していない場合は、まずできることを探す必要があります。テスラのシーンはもともとロボットアームによって実現されており、人間の代わりにさえなかった。薬局で行われる作業は人間によって行われ、難易度自体はテスラよりも高いです。第二に、異なる医薬品は標準的な製品ではなく、異なる注文は標準的な要件ではないため、産業オートメーションだけでは達成できません。

テスラをモデルとみなさないでください。リモート操作ではデータの問題を解決できない

「遅刻」: データ不足は、今日の身体化された知能の難しさの 1 つです。テキスト データは現在 15T、写真は 6B、ビデオは 2.6B ですが、ロボット データはわずか 2.4M です。 Tesla と Google はどちらも「遠隔操作」、つまり実際の人間に収集装置を装着させてロボットが学習する必要がある動作を完了させることでデータを収集しますが、Galaxy General は「すべて Sim2Real 内で」、つまりシミュレートされた合成データを使用しています。なぜあなたは彼らと違うのですか?

Wang He: 遠隔制御はスタートアップ企業が買えるようなものではありません。遠隔操作では、多くの人員を雇用してさまざまな操作を繰り返し実行する必要があります。有効なデータを取得するには、ロボットと人間が 30 秒または 1 分間一緒に過ごす必要があります。

ここが、人型ロボットが自動運転と大きく異なる点です。テスラの自動運転により、100万人の自動車所有者は、データに追加のお金を費やすことなく、お金をかけて車を購入し、何億時間も運転できるようになります。運転といっても、工場にはさまざまな種類の仕事があります。接着する人、電池を入れる人、ネジを締める人など、さまざまな作業間の相関関係は強い場合もあれば弱い場合もあります。

テスラは、電池を置く現場で遠隔操作を行うために数十人を見つけましたが、その後、巻き上げや組み立てなどの操作シーンが増え、それだけではありませんでした。テスラは、独自のロボットを購入するための多額の資金と独自の工場を持っていますが、それは可能ですが、新興企業はそれができません。

現在、自動運転車に遠隔モニターが搭載されているのと同じように、遠隔操作は遠隔操作の役割を果たすことができます。現場でロボットが作業中に問題が発生し、現場に人がいない場合は、遠隔制御を使用して介入できます。

「その後」:リモコンって大手企業が作ったゲームなんですか?

ワン・ホー: これはマスクが語っている話です。正直に言うと、これは研究です。

GoogleがRT(ロボットトランスフォーマー、ロボット制御アルゴリズム)に取り組んでいたとき、200人以上の「Every day Robots」チームがありましたが、RT-1終了後、この部門はビジネスモデルが存在しなかったため廃止されました。

現在、中国の体現型インテリジェンス企業の中で、米国のテスラとグーグルを模倣できるのは、独自のルートを持たない企業だけだ。アメリカの企業が十分な資本を持っていないのに、他人の話をまだ伝えているとしたら、それは行き止まりになります。

「後で」: これは汎用ロボットの作成に必要なデータ量にも依存しますか? それが 1 桁未満であれば、特に裕福な大企業や資金調達できる新興企業でもリモートを実行できる可能性があります。運行ルートは?

Wang He: 私たち自身の実験では、たとえば、データのクロールが 10 億回ある場合、データ量が 1 万分の 1 に減少すると、ロボットの成功率は 87% に達することがわかりました。 、つまり 100,000 初めてクロールしたときの成功率はわずか 58% でした。これは、身体化された知性にも明確な拡大法則があり、データに対する渇望がより強いことを示しています。

現実の世界では、数十億のデータを取得することは困難です。 Google が数十万件のデータを編集するのに 10 か月以上かかり、数千万ドルもかかりました。

「後半」:シミュレーションでどれだけコスト削減できるのか?

Wang He: シミュレーション合成により、60 枚すべての画像を 1 秒でレンダリングできます。現実世界のデータを収集するのと比較して、合成データはほぼ無料です。 2 番目の曲線は、現実世界からデータを取得することです。

シミュレーターでは、各オブジェクトの動きを 200 個のビデオに合成し、次に単一のオブジェクトをシミュレートしてオブジェクトのクラスに合成します。これにより大量のデータが生成され、それをロボットの把握能力のトレーニングに使用します。

「遅い」: エミュレータ (疑似仮想環境を提供するシステム) を使用して取得された合成データは当然現実世界のデータとは異なるため、トレーニング効果に影響を与えると多くの人が考えています。どうやって解決しますか?

Wang He: シミュレーターを完全に現実のものにすることはできませんが、Sim2Real ルートでは、シミュレーターを完全にシミュレートする必要はありません。これは、ハードウェア、アルゴリズム、シミュレーションを統合して最適化するプロセスです。

この段階では、シミュレータは検証ツールであり、アルゴリズムで表現された数学的物理モデルがクローリング資格を取得するための核心となります。

たとえば、シミュレータにはいくつかの制限があります。たとえば、手がミネラルウォーターのボトルに触れるとき、つまり、柔軟で変形可能な手が実際に変形する可能性のある一見硬い物体に触れるとき、このプロセスは点接触ではなく、摩擦によるものではありません。物理的に完璧にモデル化されています。

現時点では、アルゴリズムには、タッチと力の制御を追加し、「形状」を学習し、それを把握した後に制御するなど、強力な適応機能が必要です。これにより、シミュレーションの最も困難な部分を回避できます。もう 1 つの前提条件は、ハードウェアが十分に堅牢である必要があることです (堅牢とは、異常な状況下でもシステムが比較的安定して動作できることを意味します)。

「後期」: シミュレータと数学モデルや物理モデルなどのアルゴリズムはどのように連携しますか?

Wang He: 私たちは効率的な検索をキャプチャするための一連の数学的および物理的モデルを提案し、シミュレーターを使用してそのようなキャプチャが実現可能かどうかを検証します。

強化学習と教師あり学習の違いについてもここで触れます。強化学習の場合、シミュレーターを何度も操作し、試行錯誤し、解決策を見つけ出すことを意味します。これには、シミュレーターの信頼性に関する多くの要件があり、シミュレーターの強化学習 Sim2Real に完全に依存します。しかし、これは試行されましたが、効率は比較的低いです。

ロボットに掴み方を伝えることができれば教師あり学習に変換でき、学習効率が高くなります。教師あり学習を使用して、2 本指と 5 本指の把握を学習します。

初日から検討してください商品化

「その後」: ヒューマノイドを製造するほとんどの中国企業は他の製品も製造しています。たとえば、Zhiyuan は商用掃除ロボットを開発しており、Zhuji と Yushu は両方ともロボット犬を製造していますが、米国は主にヒューマノイド ロボットを直接発売しています。なぜこのような違いがあるのでしょうか?

王鶴氏:中国と米国では資本の豊かさが違います。アメリカではお金があるから一気にやります。 Figure AI や Tesla などの企業はすべて人型モデルを使用しています。ただし、Figure AI の現在の評価額は 25 億米ドルであり、デモで示される操作は運動能力とは何の関係もありません。米国ではバブルのせいで、非常に厳密なPMF(プロダクト・マーケット・フィット)の観点から考えることができなくなっています。

今年 8 月、FigureAI は新しいロボット Figure 02 をリリースしました。このロボットはすでに BMW 自動車工場でいくつかの組み立てデモを行うことができます。

「後」:最初から製品の実装を考えるのが正しいと思いますか?人型ロボットのような最先端の分野ではそれは心配すぎますか?

Wang He: 一方で、それは依然としてデータの問題です。身体化された知能はハードウェアに縛られているため、ロボットが現場に配備されていない場合、大量のデータを取得することは困難です。しかし、本体の構築コストが高すぎるため、無料で大量に配布することはできません。ロボットに比べて普及コストがまだはるかに低いため、データを取得するために大規模なモデルを商品化する必要はありません。

同時にロボットにも磨きが必要です。現場でロボットを長期間観察しなければ、ロボットが安定して動作できる状態まで反復することは不可能です。これは、ロボット分野に PPT 企業が存在しない理由でもあります。

「後で」: どのような製品の実装を見てきましたか?

Wang He: 最初のステップは、同じ工場や同じ生産ライン内でさまざまなものを移動するなど、単一環境内の複数のオブジェクトに対して単一の操作を実行することです。これは現在、Google RT-1 と Tesla Optimus が行っていることですが、Optimus が処理できるオブジェクトの数は少なくなります。これらは両方とも真に一般化されていない、つまり普遍的ではなく、まだ実際にお金を稼ぐことはできません。

次のステップは、ロボットが同じ業界の異なるシナリオで異なるオブジェクトに対して同じ操作を実行することです。たとえば、工業製造業では、自動車工場で部品を入手できることからあらゆる工場ですべての部品を入手できるようになり、小売業界では、小規模なスーパーマーケットで商品を在庫できるようになりました。ウォルマートに商品を在庫できるようになりました。同じ業界のさまざまなシナリオを分析する 1 回のトレーニング セッションは非常に価値があります。

次のステップは、より多くのタスク、より多くのシナリオを用意し、業界全体ですべてを処理し、引き続きユニバーサルになることです。

「後で」: 業界全体が最初の一歩を踏み出しているところです。現時点では、最初のシーンまたは最初のシーンをどのように選択しますか?

Wang He: どの業界でも、柔軟な生産であっても完全に自動化されていないシナリオである限り、身体化されたインテリジェントロボットが導入される可能性があります。特に製造業では目立たない業務も多く、要求される技術も複雑ではない可能性があります。

簡単な作業から難しい作業へ、人件費の高い作業から低い作業へ、需要の高い作業から需要の低い作業まで、一つずつ実行しなければなりません。

「後で」: 薬局で薬を入手することは、あなたの言った論理に適合しますか?それとも美団が投票したからこのシーンをやったのでしょうか?

Wang He: 私たちは、より強力な汎用性を実現できる高収益、高価値のシナリオをいち早く掴みたいと考えています。私たちの将来の目標は、家庭に参入することです。

純粋なto BよりもB to Cのほうが家庭での利用に適しているため、小売業にB to Cのシーンを設け、人々と交流します。

「後で」: 最初のロボットはいつリリースされますか?

Wang He: 今年の第 4 四半期には 500,000 個の小ロット注文を受け付けます。

「後で」: 薬局で薬を買うのは高すぎますか?

Wang He: 現在、当社には科学研究シナリオと Meituan のような商業シナリオという 2 つの主な販売方向があります。これらのシナリオの価格と構成は異なります。

私たちが科学研究シナリオに販売するのは、十分なコンピューティング能力を備えた開発可能なバージョンです。当社が商用シナリオ向けに販売する製品は開発をサポートしておらず、いくつかの機能を追加し、その他の不必要な機能とコンピューティング能力を削減します。たとえば、現在ロボットには OrinX カードが搭載されていますが、商用シナリオではコンピューティングをクラウドに配置できます。 。

現在、科学研究の現場には数十件の予約が存在します。ビジネスシナリオでは、マシンからサービスに至るまで、当社のチームがプロセス全体に責任を負います。

「その後」:ギャラクシーはロボット一式の価格を5万元に抑える予定だとかつて言っていましたが、それはいつ頃になるのでしょうか?

王鶴:今年は無理ですが、1,000台、10,000台に達したら、引き続きこの目標に近づいていきます。

「その後」:中国における人型ロボットの販売は新興企業や大学研究室、その他の同業他社によって支えられているというジョークがある。

王鶴氏: 科学研究の上限は確かに低いですが、科学研究は最初のステップです。玩具でない限り、創業 1 年の会社がロボットを 1,000 台販売することは不可能です。

「その後」: 身体化インテリジェンス業界における現在のコンセンサスが取れていないことについては、これまで何度も話してきましたが、現在のコンセンサスは何だと思いますか?

汪和氏: これまでのところ、大規模な経済利益を生み出す具体化されたインテリジェンスシナリオは登場していません。お金を稼ぐ方法についてのコンセンサスがないため、製品の形式、テクノロジー、業界、押し戻されるシナリオについてもコンセンサスがありません。

コンセンサスがないのは良いことだ。つまり、全員が合意に達した場合、最後の戦いはコスト、リソース、コネクションになります。これらの要素は起業家が得意とするものではなく、起業家精神に有害です。

しかし、未来、テクノロジーの終焉、家庭 + 完全な人型 + 大型模型の登場を想像すると、残念ながら誰もがこれに同意できると思います。

「その後」: 現在エンボディドを追求している多数の新興企業についてどう思いますか? 汎用性 旅は?

王和:これは人間が再び創造主の役割を果たす過程です。自動車産業も完全に人間が作り上げる産業であり、今後の汎用ロボットも同様です。テスラのような大手自動車会社も登場するでしょう。