魏暁莉の端から端まで: 形は違うが、喜びと悲しみは絡み合っている
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
中国のインターネット上では、マスク氏は「原初の神」と揶揄されることが多い。テスラオープンソースがなければ、中国は純粋な電気自動車を製造することはできないだろう」と国を憎む政党。しかし、インテリジェント運転の分野では、テスラは確かに、AI Dayを開催して技術的な詳細を共有することで、長い間、業界の見通しの方向性を導く灯台の役割を果たしてきました(注:灯台は複数ある可能性があります)。しかし、テスラは昨年から AI Day を中止し、技術の進歩のみを発表し、技術の実装については語らなくなりました。それは、エンドツーエンドの技術ソリューションを使用する FSD の頻繁な良いニュースだけでした。今年、さまざまなスマート ドライビング企業がテスラによるエンドツーエンドの演習を公開したところ、解答欄に突然小さな単語が並んでいるのを見つけました。「問題を解決せよ」プロセスは省略します。参照回答なしでエンドツーエンドを行うにはどうすればよいですか?エンドツーエンドのスマートドライビングの研究開発は合理的なビジネスモデルに支えられているのか?質問はまず、新車生産部隊の代表である魏暁麗氏になされた。01
ブラックボックスを開けてください
昨年から今年上半期まで、国内のスマートドライビングプレーヤー間の競争の主なテーマは、伝統的なモジュール技術アーキテクチャの下で人海戦術で都市の開業速度を競うことでした。この過程で、魏暁利氏のスマートドライビングチームは1000人(以上)に拡大し、コーナーケースを制覇するために昼夜を問わずトレーニング、テスト、検証を行った。Tesla FSD はエンドツーエンドの効果を検証し、誰もが作業の重複から解放される機会を提供します。しかし、その代償として、従来のスマート運転技術スタックの各モジュールはテストおよび検証できるのに対し、エンドツーエンドのスマート運転システムは結果のみがわかり、プロセスはわからないブラックボックスです。Wei Xiaoli はエンドツーエンドへの移行を進めており、直面する共通の問題は次のとおりです。スマート運転などの安全性が強く求められる機能では、完全なブラックボックスは受け入れられません。このブラックボックスを開き、「システムがなぜこれを実行したいのか」を理解する方法を見つけるか、少なくともその出力を相対化する必要があります。制御可能。小鵬選択は、セグメント化されたエンドツーエンドのプログレッシブ ルートであり、その技術的ソリューションは、シーンの理解に焦点を当てた知覚ニューラル ネットワーク XNet + 計画ニューラル ネットワーク XPlanner + 視覚言語モデル XBrain です。Xpeng のエンドツーエンドのセグメント化
エンドツーエンドのテクノロジー チェーンでは、現在、セグメント化されたエンドツーエンドが下流にあります。急進派は、セグメント化されたエンドツーエンドは依然として従来のソリューションの範囲から脱却していないと考えています。認識と計画の両方にニューラル ネットワークが実装されていますが、重要な点は 1 つ変わっていません。それは、2 つのニューラル ネットワークを接続するインターフェイスが依然として人間であるということです。これは、情報の損失と大量の手動による注釈を意味し、全体的な最適化や自動化には役に立ちません。しかし、セグメント化されたエンドツーエンドの利点もここにあります。人間が定義したインターフェイスがあるため、人間が理解できる中間結果が出力され、問題の確認や特定に便利であり、全体には影響しません。センシングの問題など、ネットワーク全体を再トレーニングする必要はありません。 2 つの小さなモデルを一緒にトレーニングすることは、1 つの大きなエンドツーエンド モデルをトレーニングするよりも難しくなく、コンピューティング リソースの消費も少なくなります。さらに重要なことは、この方法は理論的にはインテリジェントな運転性能の下限を維持するのが容易であるということです。7月30日、XpengのXNGPスマートドライビングが全国的に本格的に開始された後、何暁鵬氏は次のように述べた。高い。"この文は友好的なビジネスマンへの戒めとして解釈されました。7 月初旬、Lili は、夏のカンファレンスで開発中の 1 段階のエンドツーエンド ソリューションである 4D One Model エンドツーエンドを紹介しました。 1 段階のエンドツーエンドでは、認識と計画が数億のパラメーターを持つニューラル ネットワークにパッケージ化され、経験豊富なドライバーの運転ビデオが最も重要なトレーニング データになります。このソリューションは、情報のロスレス伝送をサポートしており、Xiaopeng や Huawei のエンドツーエンド ソリューションよりも高度な自動化が行われています。しかし、このエンドツーエンドのソリューションには一般化が弱く、解釈性が低く、下限が不安定であるなどの問題があります。このため、Ideal は 22 億パラメータ規模の VLM (Vision-Language Model) をエンドツーエンドのソリューションに接続しました。大型モデル。このモデルは、複雑な交通シーンや交通文字標識をより深く理解しており、エンドツーエンド モデルでの運転決定の参考を提供し、インテリジェント運転システムのパフォーマンスを向上させることができます。理想的エンドツーエンド+VLM高速および低速システムのスマート運転ソリューション8月には、アイデアルのエンドツーエンド+VLM高速および低速デュアルシステムスマート運転ソリューションがプロユーザー向けに数千人を対象とした社内テストを開始し、関係者は今年末か来年初めに一般ユーザー向けに発売する予定としている。 。これ以前は、Ideal は Zhijia に対するユーザーの認識をリードしていなかったので、売上にマイナスの影響を及ぼしていました(特に、世界に問う時間)。エンドツーエンド + VLM は、コーナーで追い越し、先頭に立つためのインテリジェントな運転能力を競う重要な戦いとして理想的に定義されます。対照的に、NIOエンドツーエンドに対して保守的かつ急進的な態度をとります。NIO は、現在のエンドツーエンドの使用が非常に限定されており、都市部の NoA には使用されず、予防安全機能のみに使用されているという点で保守的です。 7 月 11 日、NIO は、従来のソリューションでは AEB シナリオが十分にカバーされていないという問題を解決するために、エンドツーエンドのソリューションを使用して AEB の推進を開始しました。NIO の根本的な側面は、今年後半に開始されるスマート ドライビングが、現在人気のエンドツーエンドのオンボーディング トレンドをスキップして、次の段階である世界モデルのオンボーディングに直接進む準備ができているように見えることです。ワールド モデルは、スマート運転業界で見られる最新の方法論です。 2023 年のトップの人工知能カンファレンスである CVPR で、テスラは自動運転の世界モデル GAIA-1 で業界で知られる新興企業 Wayve.ai の研究開発成果を実証し、10 億米ドルを調達しました。今年の5月。大量の実際の運転シーンのビデオを学習することで、ワールド モデルは将来の一定期間内の運転シーンのビデオを予測して生成し、正しい運転判断を下すことができます。その本質は時空推理です。これは人間の運転行動と似ており、経験豊富なドライバーは他の交通参加者の行動や交通の流れの変化を頭の中で予測、推測し、それに基づいて運転操作を計画します。現在のエンドツーエンドのワールド モデルよりもさらに進んでいるのは、その中心的なタスクが、計画された経路を提供するだけでなく、「運転シーンにおけるピクセルの変化を予測する」ことであるということです。この非常に困難なタスクにより、モデルは優秀なドライバーの行動を学習するだけでなく、広範な交通知識と物理学も学習する必要があります。Weilai が NIO IN で提案したのは、さらに複雑で出力次元が大きいため、真の値と比較することでより多くの監視信号を形成でき、ニューラルのトレーニングを加速します。また、システム運用のブラック ボックス レベルも削減します。しかし、その代償として開発難易度が高くなります。NIOワールドモデル、たくさんあります予測タスクの出力
参考までに、デモのみに使用され、計画されたパスとビデオのみを出力するワールド モデル GAIA-1 をトレーニングするために、Wayve.ai は 4700 時間のビデオ データを使用し、A100 の 160 ブロックで 15 日間トレーニングしました。 NIO がトレーニングしたい世界モデルには、一桁以上高いデータとコンピューティング リソースが必要です。トレーニングが完了した後、精度と実行速度を確保しながら、計算能力と帯域幅が非常に限られている複雑で巨大なワールド モデルをどのように圧縮して Orin-X に詰め込むかは、もう 1 つの複雑な問題です。現在、初めてエンドツーエンドを試している魏暁利さんは(採用は慎重ではあるものの)、エンドツーエンドの「上限を上げ、下限を下げる」効果を感じています。さまざまな程度。たとえば、Xpeng の最新バージョンである XNGP は、前例のない U ターン機能を備えていますが、高速でのインテリジェントな運転パフォーマンスが低下していることがフィードバックで示されています。Ideal のエンドツーエンド + VLM ソリューションは内部テスト中ですが、上限が高く、下限が変動しています。NIOが推進しているエンドツーエンドAEBは、カーブの死角などの非標準的なシナリオでゴーストプローブを極端に回避する性能を備えているだけでなく、誤ブレーキが増加しているとユーザーから批判されている。02
L4の研究開発、L2の見通しは?
下限を把握することが難しい場合、自動車会社は常にエンドツーエンドに目を向けてきました。これは主に、エンドツーエンドの上限が十分なユーザーエクスペリエンスの向上とそれに伴うビジネスチャンスをもたらすためです。しかし、自動車会社がエンドツーエンドでの関与を強めるにつれて、スマート運転の入出力比は計算できるのか?という疑問が頭の中に残ります。より多くのFSDを販売するために、テスラは今年3月にサブスクリプション価格を月額199米ドルから月額99米ドルに引き下げた(買い取り価格は1万2000米ドルから8000米ドルに引き下げられた)。しかし、今年5月、外資系データコンサルティング会社が3,500人のユーザーのクレジットカード決済情報を分析し、FSDのコンバージョン率がわずか2%であると判断したため、マスク氏は「コンバージョン率ははるかに遠い」というXに関する噂に反論した。 2%以上お願いします。」しかし、2%をはるかに超えるだけでは十分ではありません。テスラはテキサス工場でスーパーコンピューティング クラスターを構築しており、H100/H200 カードは 100,000 枚に達すると予想されており、H100 あたり 25,000 米ドルの優遇価格で、コンピューティング カードの購入にかかる資本支出だけで 25 億米ドルを超えることになります (拡大)。データセンターとして構築して運用し続けるよりも高く、価値がある年間 208 万台のテスラ車に対する FSD サブスクリプション料金。国内自動車会社のスマートドライビングビジネスモデルはさらに楽観的ではない。Xiaopengの今年のAIの研究開発費は35億元で、Idealは今月、スマート運転の資金調達基準を10億ドルに設定しているが、XpengのXNGPとIdealのNOAはどちらもハイエンドモデルに標準装備されているため、費用を支払う必要はない。購入。 NIOは無料戦略を採用していないが、ハイエンドのスマート運転機能NOP+の価格は月額380元で一時的に収益を上げたが、現在は新車に1~2年間のNOP+の無料使用期間が付いている。テスラを含め、国内外のハイエンドスマートドライビングはまだ損をするか儲かるかの段階にある。矛盾は、都市部 NOA の競争に参加し、エンドツーエンドのパラダイムに移行した後、これらの企業のインテリジェント運転の研究開発の強度は、実際には L3、さらには L4 自動運転に向けられているにもかかわらず、主流市場はまだ残っているということです。それらの価値は「有料の L2 運転支援にコストをかける価値はない」と考えています。この「期待値と実績値のギャップ」を解決するには、L4自動運転市場最大手のロボタクシーに参入することが最も有力な方法と言えそうだ。2018年、モルガン・スタンレーはウェイモのロボタクシーを800億米ドルと評価した。マスク氏の最大のファンであるアーク・インベストメントのムー・ジエ氏は今年6月、テスラ・ロボタクシーの収益は2029年に「控えめに」6,030億米ドルに達し、それまでにテスラの市場価値は7兆ドルに達するとの予測を示した。これに先立ち、マスク氏はTwitterでロボタクシーモデルを8月に発売すると発表した(すでに10月10日に延期)。03
今年、魏暁利氏の前では、ロボタクシーを行うかどうかが大きな話題となっている。テスラに最も近いXpengの場合、答えはYESです。 7月、何暁鵬氏は小鵬汽車が2026年にロボタクシーを発売する予定であることを公に明らかにした。He Xiaopeng 氏は、Robotaxi のハードウェア要件は想像よりもはるかに複雑ですが、急速に成長できるエンドツーエンド + 大規模モデル ソフトウェア アルゴリズムの組み合わせで、L4 自動運転を解決するには十分であると考えています。 He Xiaopeng 氏のチームの目標は、2025 年後半に、XNGP エクスペリエンスが Google Waymo の Robotaxi と比較してベンチマークとなることです。しかし、自動車製造自体はすでに資産を多く必要とするビジネスであり、多数のロボタクシーを建設し、自動運転タクシー配車プラットフォームは、ビジネスチェーンと投資回収サイクルを無限に延長します。Googleは今年Waymoに50億米ドルを投資しており、Xpengがこれほど裕福であることは不可能だ。6月から7月にかけて、何暁鵬氏は滴滴出行の鄭偉CEOとウーバーのダラ・コスロシャヒCEOを訪問した。同氏は、XpengはRobotaxiの運営を望んでいないが、モデルと自動運転技術を世界的なパートナーに輸出したいと考えていると述べた。ウーバーのロボタクシー、ヒュンダイと提携
自動車会社によるエンドツーエンドのロボタクシーへのアプローチは、元TuSimple CEOのHou Xiaodi氏、Pony.ai CTOのLou Tiancheng氏、青州Zhihang社長のHou Cong氏など、多くのL4自動運転実践者からの反発を招いている。彼らの中には、自動車会社のエンドツーエンドの神話を怒って批判したり、自動車会社の関連能力システムが健全ではないと言う人もいたが、核心的な議論は同じである。自動車会社のハイエンドのインテリジェント運転は急速に進歩していますが、基本的には運転支援の枠組みの中で設計されており、ロボタクシーにとって最も重要なのは使いやすさとコストです。目標が異なるため、両者が同じソフトウェアとハードウェアを使用することが難しく、自動車会社がハイエンドのスマート運転からロボタクシーにスムーズに移行することは困難です[1][2][3]。これは李斌の心に響きます。 7月27日のインタビューでは、彼は「ロボタクシーがエキサイティングな成果やビジネスモデルだとは思わない」と明言し、怒って次のように述べた。「スマート運転の価値は、今日の運転手やタクシー運転手の重労働を排除することではありません。」彼がロボタクシーについて楽観的でないもう一つの理由は次のとおりです。道路資源や政府の規制が限られているため、ロボタクシーは無制限に導入することができず、ソフトウェアクラウドサービスのような限界利益の高いビジネスモデルを持つことが困難となっている。Li Bin 氏は常に、人々は自分の車を所有したいと思うだろうと主張してきました。そのため、NIO スマート ドライビングの目標は、ドライバーがエネルギーを解放し、事故を減らすことを支援することです。ビジネス ルートのキーワードは、より多くの車を販売するというスケール効果です。一般ユーザーと十分なサブスクリプション料金を持っているユーザーには、ハイエンドのスマート運転のためにサブスクリプション料金が請求され、コストを薄め、収益を得ることができます。しかし、高コストのスマート運転を前にすると、NIOの累計ユーザー規模は60万人未満ではまだ不十分であり、スマート運転機能の輸出も選択肢となっている。 NIO のスマート ドライビング担当責任者、Ren Shaoqing 氏は最近、NIO がバッテリー交換に対してオープンであるのと同様に、NIO がスマート ドライビング ソリューションを初めて他の自動車会社にオープンする意欲を表明しました。対照的に、Zhijia の Li Xiang 氏は「技術的な判断は急進的であり、ビジネス戦略は保守的」です。李翔氏は今年の重慶自動車フォーラムで、エンドツーエンド+VLMの組み合わせで3年以内にL4レベルの自動運転を実現すると旗を立てた。しかし、違うのは、Ideal はロボタクシー ビジネスについて考えたことがないということです。これまでのところ、アイデアルはスマート運転ソフトウェアの有料化に関心を示していないが、その公式ウェブサイトのロゴは依然として「あらゆるシナリオのスマート運転、生涯サブスクリプション料金ゼロ」である。これは理想的な競争状況に関係します。この1年、理想は直面しました紅蒙志興、売上高は大きな圧力にさらされています。宏蒙志興の最も鋭い槍は、ファーウェイの ADS インテリジェント運転機能です。紅蒙志興が各界からファーウェイADS 3.0(買収価格は約1万元)で押し寄せ、アイデアルへの圧力がさらに高まっている現在、以前よりも使いやすく無料のアイデアルのAD MAXスマートドライブが助けになるだろう。さらに複数の注文を受け取ります。 Xpeng や NIO とは異なり、理想的なスマート ドライビング KPI は営業利益を獲得することではなく、売上に貢献することです。しかし、国内の自動車産業がノックアウトステージに突入する中、魏暁利のスマートドライビング事業は長い間友人関係を築く状態に留まり続けることはできない。トレーニング カードの費用は 10 万元から、千人のチームの人件費は年間 10 億元からです。魏暁利の最も高価なビジネスの 1 つである Zhijia は、奇跡を達成するためにより多くのリソースを消費する道に乗り出しました。 、しかし、それが奇跡的な努力の報いを得ることができるかどうかはまだ不確実性でいっぱいです。[1] ホウ・シャオディ、慎重な勇敢な男、Jiazi Guangnian
[2] Robotaxi について Lou Tiancheng 氏に語る: 「L2 が強力であればあるほど、L4 から遠くなる」、Tencent Auto
[3] Tesla がロボタクシーをシンプルにする Qingzhou Zhihang 共同創設者 Hou Cong 氏との会話 | Yunjian Insight