ニュース

Liu Yudong: 自動運転業界の進歩を共有 - エンドツーエンドの技術革命

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

本文 | チタンキャピタル研究所

最近では、百度の自動運転オンライン配車サービス「キャロットラン」が話題となり、2024年8月にはテスラが「ロボタクシー」を発売する予定となっている。同時に、国内では自動運転の発展を促進する政策が集中的に導入されている。 -自動車の運転 2024 年初めに、工業情報化省を含む 5 つの部門が共同で、主流の一級都市と二級都市を対象とした「車両・道路・クラウド統合」アプリケーションの試験的通知を発行しました。自動運転技術は新エネルギー車業界の重要な成長原動力となる。インテリジェント運転分野では、エンドツーエンドのアーキテクチャが徐々に今年の競争の主要テーマとなり、最先端を争うため、自動車会社は研究開発に力を入れ始めている。

スマートな走行路のための投資ロジックは何ですか?エンドツーエンドの自動運転技術の開発トレンドは何ですか?最近、Titanium Capital は、Chentao Capital のエグゼクティブ ゼネラル マネージャーである Liu Yudong 博士を招待し、関連トピックについて共有しました。彼は、吉利汽車研究所と滴滴出行で勤務し、スマート ドライビング トラックへの投資に注力してきました。複数のスマート電気自動車の運転システムの量産開発と知覚アルゴリズムに関する先進的な研究に携わり、技術計画、製品定義、チーム管理、環境協力などの分野で豊富な実践経験を持っています。この共有のホストはTitanium CapitalのWang Zeqingで、新エネルギー、新素材、AI、ロボット産業チェーン、輸送分野に重点を置いています。

Chentao Capital インテリジェント ドライビング トラックの投資ロジック

1. インテリジェント運転への注力

Chentao Capital は新興産業に焦点を当てたプライベート エクイティ投資機関であり、インテリジェント ドライビングはその主要な投資分野の 1 つです。スマート運転分野に注目する主な理由は 3 つあります。第一に、スマート運転は交通と人工知能を組み合わせた分野として、巨大な市場空間を持ち、1 兆レベルを超えると予想されています。第二に、スマート運転は長期的なものです。最後に、インテリジェント運転業界の人材と技術は非常に柔軟であり、中核的な技術人材の流れが投資機会をもたらします。 AIやロボットなどの関連産業。

Chentao Capitalは過去7~8年間、約20社のインテリジェント運転関連企業に投資しており、投資のほとんどはシードラウンドとエンジェルラウンドの段階で行われ、重要株主として参加した。投資分野は主に 3 つのセクターに分かれています。1 つ目は、鉱山、港湾、都市流通、衛生清掃などのさまざまなセグメント化されたシナリオに焦点を当てている自動運転企業です。2 つ目は、インテリジェント運転に関連するコアサプライチェーンです。ワイヤー制御シャーシおよび上流のセンサーおよびコンポーネント企業、3 つ目は、過去 2 年間で特に注目を集めた自動運転関連のソフトウェアおよびサービス企業、特に生成 AI およびデータ サービスです。

2. 業界は成長サイクルの第 2 波を迎えています

インテリジェント運転は長期的な軌道と見なされている 2015 年以来、中国の自動運転市場は最初の成長の波を経験しています。過去 2 年間で注目度は低下しましたが、この傾向は Gartner のテクノロジー開発曲線と一致しており、将来的には依然として大きな成長の可能性と投資機会があることを示しています。

現在、インテリジェント運転業界は第一波の投資ピーク後の調整期にあり、商業化やその他の課題に直面しているが、長期的な見通しは依然として楽観的である。当社はテクノロジーの発展傾向を明確に予測しており、業界は成長サイクルの第 2 波が始まっていると信じています。このサイクルの兆候としては、自動運転企業の商用化の転換点や関連企業の上場の波などが挙げられ、インテリジェント運転業界が新たな投資段階に入ったことを示しています。したがって、私たちのファンドは昨年投資を開始し、新たな機会を探し続けています。

Chentao Capital は現在、2 つの投資方向に焦点を当てています。1 つ目は、自動運転技術が交通手段を変革し、実用的な価値を生み出すと信じて、さまざまなシナリオでの自動運転の商業化です。2 つ目は、特に自動運転の分野における最先端の技術的進歩と応用です。エンドツーエンドの自動運転技術は、今後 2 ~ 5 年間の自動運転業界の変革の主な要素となるでしょう。自動運転分野における大型モデル、4Dミリ波レーダー、ライダー技術、各種チップ技術などに高い感度と注意力を維持します。次の共有では、自動運転のさまざまなシナリオとエンドツーエンドのテクノロジーについて具体的に説明します。

3. 自動運転のさまざまなシナリオに向けた投資ロジック

当社では、4 象限分類手法を使用して、速度 (低速、高速) と負荷 (物を運ぶ、人) に基づいて自動運転の適用シナリオを区別します。技術的な難易度としては、低速よりも高速の自動運転が難しく、物を運ぶよりも人を運ぶのが難しく、特定のシナリオよりもオープンシナリオの方が難しい。したがって、Chentao Capital は当初、鉱山輸送、ターミナル物流流通、無人清掃、港湾シナリオなどの市場セグメントを含む、低速貨物積み込みのための無人運転の分野に投資を集中しました。

4. さまざまなシナリオにおける自動運転の実用化の進捗

To G、TO B(エンタープライズ市場)、TO C(コンシューマ市場)に分けます。 TO G の分野では、衛生とセキュリティが主な適用シナリオであり、環境衛生は初期の大規模導入を達成しており、一部の都市ではセキュリティ検査ロボットが使用されています。

TO B 側では、鉱山や港湾における無人運転の実用化が最も急速に進んでおり、明確なビジネスモデルが形成され、大規模な再現が始まっています。

また、都市部の配送シーンは今年爆発的に成長しており、大手企業は保有台数を数万台に拡大し、10倍以上の規模拡大を実現すると発表しています。都市物流の急速な成長は、エクスプレス物流会社との協力、生鮮食品スーパーマーケットの物流など、物流リンクで適切なアプリケーションシナリオを見つけたことによるものです。 B側幹線物流については、オープンシナリオかつ技術的に難しいため、まだ小規模な試験運用の段階にある。

C側の自動運転アプリケーションは主にRobotaxi(無人タクシー)やRobobus(無人バス)です。

5. 無人タクシー:キャロットランの進捗概要

Baidu の キャロット ラン プロジェクトは、自動運転業界全体に対する破壊的な影響を示す前向きなシグナルです。

自動運転シナリオには、自動運転、大規模、商用化の 3 つの開発段階があります。無人化の段階では、百度はすでに無人運転能力を実証しており、2022年には無人ロボタクシー(無人タクシー)を実現し、武漢などで無人実験を実施し、遠隔操作運転センターを通じて無人タクシーの運行を支援している。規模に関しては、百度は年末までに約1,000台の車両を導入する予定であると発表しており、すでに規模の兆候を示している。商業化段階では収益性が重視されており、ロボタクシーの収益化の時期はまだ不透明であり、主に遠隔操作運転の安全率と会社の将来の価格決定力に依存すると劉裕東氏は考えている。現在、ロボタクシーは補助金という形で超低価格のサービスを提供しているが、今後も乗車料金を引き上げながら受注規模を維持できるかどうかが業界の注目点となっている。

自動運転業界は、商業化の試みが活発に行われていますが、課題に直面していますが、技術の進歩とビジネスモデルの革新により、業界の将来の発展に幅広い余地が与えられています。 Baidu などの企業の実践は、テクノロジーの開発を促進するだけでなく、業界全体の商業化の探求に貴重な経験を提供します。

キャロット ラン プロジェクトは、テクノロジー、業界、産業界の 3 つのレベルで大きな影響を与えました。技術レベル: Luobo Kuaipao は、車側アルゴリズムと遠隔制御運転を組み合わせたシステム ソリューションをデモンストレーションし、スケーラブルなソリューションを提供します。このモードは、車両側のテクノロジーがまだ完全ではない場合に、消費者にリモコン運転による真のドライバーレス体験を提供します。将来的には、より多くの乗用車 OEM やその他の自動運転企業がこの計画を参考にして、無人タクシーの普及を促進する可能性があります。

産業レベル: Luobo Kuaipao の比較的大規模なアプリケーションは、産業の分業を実証します。これには下流のオペレーターと上流の部品会社が関与し、これらの関係者にさらなる利益をもたらします。事業が成熟するにつれて、百度は事業と資産保有計画をさらに洗練し、産業分業を促進する可能性があり、これは業界全体の発展に有益です。

業界レベル: キャロット ランの輪を打ち破る効果により、自動運転業界に対する一般の関心が再燃しました。このイベントは自動運転業界における「ChatGPT の瞬間」であり、これは技術的な進歩であるだけでなく、より重要なことを意味します。 、世間の注目を集めています。より多くの人々が注目するにつれ、自動運転業界には人材や資金など、より多くのリソースが集まることになるでしょう。

エンドツーエンドの自動運転技術開発動向

エンドツーエンド技術の開発は、学術界や産業界での徹底した研究を促進するだけでなく、自動運転業界に新たな投資機会と研究の方向性をもたらします。このエンドツーエンド技術はまだ探索段階にありますが、将来の自動運転分野での応用の見通しは幅広く、業界や投資家が細心の注意を払う価値があります。

1. エンドツーエンドの自動運転が産業革命の新ラウンドを開く

エンドツーエンド技術は、昨年学術界や産業界から広く注目を集めており、特に上海人工知能研究所の研究成果がCVPR2023最優秀論文賞を受賞したことを受けて、再び学術界の注目を集めるようになりました。 2016 年から 2018 年にかけてのエンドツーエンド コンセプトの探求プロセス、この分野におけるテスラの積極的な姿勢、および 2023 年 8 月のイーロン マスクのライブ ブロードキャストでは、エンドツーエンド アーキテクチャに基づく FSD v12 が実証され、正式にエンドツーエンドの推進を開始しました。トゥエンド市場。過去6か月間、中国の大手インテリジェント運転企業はエンドツーエンドの自動運転計画を相次いで立ち上げた。 2024年5月、エンドツーエンドの自動運転システムの開発に注力する新興企業Wayveが10億米ドルの資金調達を受けた。これは、自動運転システムの開発以来、初めての10億米ドルを超える資金調達となった。自動車産業は 2022 年に谷期に入り、資本市場がこの分野の発展に楽観的であることを示しています。

2. 自動運転アーキテクチャの進化

エンドツーエンドとは、センサーの入力から軌道計画や制御信号の出力までのプロセス全体をAIやニューラルネットワークによって完全に実装する技術です。

エンドツーエンド技術の開発はいくつかの段階に分かれています。1 つ目はエンドツーエンドの認識であり、認識モジュールは深層学習によって実装されていますが、意思決定の計画は依然としてルール定義に基づいています。意思決定計画のモジュール化。ルール定義を AI ネットワークの意思決定計画に置き換えようとします。次に、画像表現の特性がモジュール間で転送され、共同でトレーニングおよび最適化できます。生成 AI と大規模モデル技術を活用した、単一のニューラル ネットワークのツーエンド ソリューションは、成熟度は低いですが、可能性は非常に大きいです。

エンドツーエンドは、大規模モデルやワールド モデルと同じ概念ではありませんが、エンドツーエンド ソリューションは大規模モデルまたはマルチモーダル大規模モデルの機能を利用する場合がありますが、エンドツーエンド システムは最近リリースされました。 Li Auto はマルチモーダルな大型モデルを使用しています。ワールドモデルは現在、主にデータを学習させるための技術的手段として使用されており、将来的には自動運転のキーテクノロジーとなる可能性があります。

エンドツーエンドのテクノロジーは、純粋なビジョン システムだけでなく、あらゆる種類のセンサーと互換性があります。 Tesla はピュア ビジョン システムのリーダーですが、エンドツーエンドのソリューションでは LIDAR やミリ波レーダーなどのさまざまな入力を統合することもできます。カメラデータは、自動運転の分野で取得および蓄積するのが最も簡単なタイプのデータであるため、ピュアビジョンシステムでよく使用されます。

3. エンドツーエンド技術の開発経緯

2016 年から 2018 年にかけて、Nvidia や Waymo などの一部の企業が初期の探査を実施しましたが、その結果は量産には至りませんでした。その主な理由は、当時のネットワーク アーキテクチャが CNN をベースとした比較的単純なものであり、模倣学習や強化学習などの学習手法も比較的基本的なものであり、高度なネットワーク構造のサポートが不足していたことです。

開発の第 2 段階には、この分野における大規模な言語モデルなどの基礎となる技術アーキテクチャの適用が含まれます。 変圧器などのネットワーク技術アーキテクチャの広範な適用と、自動運転モデル​​の複雑さと信頼性の向上が、この段階における中心的な変化です。同時に、生成 AI と大規模言語モデルは、一般的な API パラダイムが物理世界における AGI につながる可能性があることを証明しており、より多くの研究者や実践者がこの方向への投資を引きつけています。

4. この1年で注目を集めるエンドツーエンド技術を支える3つの原動力

1 つ目は、Tesla V12 システムのパフォーマンス指標が 2 倍になったことです。2 つ目は、よりロングテール シナリオの解決とユーザー エクスペリエンスの向上という擬人化された側面を含む、エンドツーエンド テクノロジー自体の製品価値です。これは、テクノロジー主導の大規模言語モデルであり、エンドツーエンド システムのデータ主導の特性とスケーリングの法則でもあります。

エンドツーエンドのテクノロジーが自動車会社や自動運転会社の組織構造に与える影響は、組織構造が簡素化され、開発反復の効率が向上することです。現在、業界の多くの大手 OEM がエンドツーエンド ソリューションの量産計画を正式に発表していますが、実際のエンドツーエンド システムが量産されるのは来年になる可能性があります。

SenseTime、Pony.ai、Horizo​​n などの自動運転システムおよびアルゴリズム企業は、エンドツーエンドの研究開発投資を開始しており、今後 6 か月から 1 年以内に OEM プロジェクトが開始されると予想しています。同時に、Light Wheel Intelligence や Jiji Technology などの生成 AI およびツールチェーン企業も、エンドツーエンド分野での予備投資と探索を行っています。

5. エンドツーエンド技術は、産業チェーンの上流技術のさらなる発展を引き起こす

エンドツーエンドのテクノロジーは、産業チェーンの上流テクノロジーのさらなる発展を引き起こし、業界の生態系に変化をもたらすでしょう。まず、AI モデルの複雑さが増すにつれて、オープンソース エコシステムが果たす役割はますます重要になります。オープンソース コミュニティには、人材の収集、大規模なコラボレーション、複雑なモデルの開発において利点があり、これは過去 3 年間の BEV 開発中に確認されました。 2021 年から 2024 年までのオープンソース プロジェクトとエッジ プロジェクトの結果を比較することで、オープンソース エコシステムとエッジ プロジェクトがこの分野の発展を促進する上で密接に連携していることが実証されました。

第 2 に、エンドツーエンドのテクノロジーは、従来のシミュレーションおよびテスト検証方法論に課題をもたらします。車をエンドツーエンドで制御する必要があるため、従来のシミュレーション手法の開ループ テストはもはや適用できず、既存のシミュレーターの忠実度には問題があります。したがって、新しい一連の閉ループ シミュレーション ツール チェーンを開発する必要があり、それには生成 AI と合成データの分野での機能を組み合わせることが必要になる可能性があり、この分野は新しい企業に機会を提供します。

第三に、エンドツーエンド技術はチップアーキテクチャの革新を促進します。より大きなパラメータを備えたエンドツーエンドの AI モデルと新しいニューラル ネットワーク オペレーターは、チップ企業に新たな課題をもたらし、自動運転 AI アルゴリズムの急速な進化に適応するには、より柔軟なチップ アーキテクチャが必要になります。

業界の発展トレンドの観点から見ると、エンドツーエンドのテクノロジーにより自動運転の全体的な普及率が加速すると考えられます。エンドツーエンド技術の登場により、今後2~3年で高速NOAや都市型NOAなどの機能が一般消費者にサービスを提供するようになることが予想されます。

エンドツーエンド技術の強力な汎用化能力により、将来的には地理的地域や国を越えてより多くの自動運転アプリケーションが登場する可能性があります。現在、新しい国に参入する自動運転企業は多くの適応型デバッグを行う必要がありますが、エンドツーエンドのテクノロジーによりこのプロセスが軽減され、複数のシナリオに適用できる能力が向上し、さらにはさまざまなシナリオの進化をもたらす可能性もあります。商用車および乗用車用。

6. エンドツーエンドの自動運転と一般ロボットの関係

2 つの分野は歴史的に互いに学び、共に成長してきました。自動運転分野の多くのテクノロジーは、センサー、知覚および測位アルゴリズム、SLAM (同時位置特定と地図構築)、計画アルゴリズム、オペレーティング システム、ミドルウェアなどを含め、ロボット産業から生まれました。

過去 5 年間、ロボット産業の発展は自動運転産業よりも遅かったものの、自動運転産業は加速した工業化を経験し、ハードウェア コンポーネントやセンサーのコスト削減が実際に自動車産業にフィードバックされました。ロボット産業。この1年で、エンドツーエンドの自動運転に代表されるデータ駆動型AI手法が徐々に量産化され、将来的には同じく汎用知能が必要とされる一般ロボットの分野にもフィードバックされることが期待されている。

将来を見据えると、自動運転とロボティクスは、物理世界で AI を実現するための 2 つの最も重要な分野です。多くの研究者は、一般的な知能を自動運転とロボット工学の 2 つの部分に分けています。物理世界で AGI を実現するという観点から見ると、タスクの複雑さが比較的低く、データと反復アルゴリズムを取得するための完全なリンクが確立されているため、自動運転業界には現在、より明白な利点があり、これによりロボット業界に学習するモデルが提供されます。から。

エンドツーエンドの自動運転の開発は、自動運転技術の進歩を促進するだけでなく、ロボット産業に新たな機会と技術的基準をもたらすものであり、両社は今後もAI技術の発展の下で相互に促進し、共同で推進していきます。物理世界での AI の実現。

Q&A

Q1: 入力センサーとしてのライダーやミリ波レーダーの今後の開発動向はどうなるのでしょうか?

A: LIDAR とミリ波レーダーのコストは、ムーアの法則に従って常に減少しています。現在出荷されているライダーと4Dミリ波レーダーの価格はそれぞれ2000~3000元と600元程度で、大きな開きがある。 2年後にはライダーのコストを1000元程度に、ミリ波レーダーのコストを300元以上に下げることができると予想されている。ミリ波レーダーは、LIDAR やカメラなどの光学システムを高度に補完します。雨、霧、雪、塵などの悪天候では光学システムが故障する可能性がありますが、ミリ波レーダーはこうした環境ではより信頼性が高くなります。長期的には、特に L3 および L4 レベルの自動運転では、さまざまなセンサーを活用することが鍵となります。 L2 レベルの場合、低コストのソリューションではビジョンとミリ波レーダーの組み合わせが好まれる場合があります。

Q2: TOB 分野のさまざまな細分化シナリオの下で、自動運転企業の粗利率は現在の水準はどのくらいですか?また、潜在的にどの水準を達成できるでしょうか?

A: TO B 社のビジネス モデルの枠組みによれば、製品の販売と運営の 2 つの異なるモデルに分けることができます。運用はプロセス全体に責任を負う必要があるため、業界発展の初期段階から、運用は企業の能力をより適切にテストし、その強みを証明することができます。相対的に言えば、価格設定が業界チェーン全体の価値を反映していないため、製品販売の粗利益率についてはあまり議論の価値がありません。現在、各事業会社は売上総利益率マイナスからプラスに転じる段階にあり、売上総利益率30%、場合によっては40%を目標としており、一部のシナリオでは依然として売上総利益率がマイナスとなっている。

Q3: 投資機関の観点から見ると、多くの人が自動運転の時代は終わったと感じていますが、業界の観点から見て、注目すべき分野はありますか?

A: インターネット業界の発展を振り返ると、どの業界でも成熟期には新たなチャンスやより細かな分業が生まれてきます。現在の自動運転業界は、2010年や2012年のインターネット業界と同様の転換期を迎えており、将来的には予想外の新たなビジネスモデルが生まれる可能性がある。投資段階の観点から見ると、一部の成長段階の投資機関にとって、特に鉱業や都市流通の分野での商業化の転換点に投資する良い時期である。これらの分野の車両規模は数百隻から増加している。数千台という大幅な増加は、商業化への明確な転換点を示しています。したがって、今は中期から後期段階の投資に適した時期です。

初期の投資では、技術の変化、特に閉ループ シミュレーションやエンドツーエンドの生成データ ソリューションなど、アルゴリズムやツール チェーン レベルで新たな機会をもたらすエンドツーエンド技術の開発にもっと注意を払う必要があります。エンドツーエンドのテクノロジーに加えて、ハイエンドのスマート運転センサーの量の増加は、上流の業界にもチャンスをもたらしています。たとえば、LIDAR の出荷量の大幅な増加により、チップやレーザーなどのコンポーネントの潜在的な市場が生まれています。ローカライゼーションの程度は低い。技術の継続的な革新と市場の拡大により、インターネット業界の成熟期にPinduoduoやDouyinが登場したように、自動運転業界にはより多くの初期投資機会が出現し、将来の発展は無限の可能性に満ちています。

Q4: オンボードのコンピューティング能力に対するエンドツーエンドの要件は何ですか?コンピューティングパワーセンターの観点から見ると、どれくらいの投資が必要ですか?

A: エンドツーエンドの自動運転技術によって、必要なコンピューティング能力が直接増加することはありません。ただし、これはデータ駆動型のソリューションであり、スケーリングの法則に準拠しているため、業界では一般に、より優れたパフォーマンスを達成するためにモデルの規模を拡大し、これにより高計算能力チップの需要が増加します。 Li Auto などの一部の企業は、より高性能なマルチモーダル大型モデルをエンドツーエンドで実行し、もう 1 つの軽量エンドツーエンド モデルを既存の自動運転チップ上に展開するデュアル システム戦略を採用しています。一方で、大規模なモデルの推論速度は遅くなり、より高い計算能力が必要になることがわかります。モデルのサイズが大きくなるにつれて、トレーニングのコストとトレーニングのコンピューティング能力の要件も増加します。エントリーレベルのエンドツーエンドのトレーニングには、A100 相当のカードが 1,000 枚必要になる場合があり、大手企業ではすでに 10,000 枚のカード レベルのレイアウトに達している可能性があります。 Tesla を例に挙げると、コンピューティング能力のトレーニングに大規模な投資を行っている企業は、他の企業が追いつくのは難しいかもしれません。Xpeng や SenseTime など、コンピューティング能力のトレーニングに巨額の投資を行っている国内企業もあります。全体として、エンドツーエンド技術の発展により、より大規模なモデルのトレーニングと展開をサポートするために、より高い計算能力のチップとより大きなトレーニング計算能力の需要が高まっています。これは、技術の進歩を反映しているだけでなく、業界の取り組みも反映しています。高性能自動運転ソリューションの追求。

Q5:現在自動運転に取り組んでいるこれらの企業にとって、人型ロボットや一般ロボットの軌道に渡る機会やチャンスはありますか?

A: 家庭用人型ロボットの開発は、テスラによる人型ロボット オプティマスの発売と密接に関連しています。 また、Figure チームには、Apple Cars と北米の大手自動車会社から人材が集まっています。自動運転とロボット工学はさまざまな方法で結びついているため、この業界を超えた人材の流れは自然なものです。

現時点では、人型ロボット本体の問題が完全に解決されていないため、自動運転技術のロボット分野への大規模な移行はまだ実現していない。業界の見解を引用すると、将来の人型ロボット企業の半分は自動車会社になるかもしれない、私は個人的にこの見解に同意します。これは、テクノロジーの発展に伴い、自動運転とロボット工学の統合がますます深くなることを示しています。

チタンキャピタル研究所視察

エンドツーエンドのアーキテクチャは、自動運転の究極のソリューションになると期待されています。現在、インテリジェント運転システムは一般的に、認識、予測、計画の 3 つのモジュールに分かれています。エンドツーエンド モデルは、3 つのモジュールを 1 つに統合し、認識側から情報を入力し、実行側で結果を直接出力します。モジュール化された技術アーキテクチャの下では、情報伝達が損なわれ、システムの保守が困難になり、複雑な道路状況に冷静に対処できなくなります。エンドツーエンド モデルでは、プログラマーがルールを策定するためのコードを記述する必要はありませんが、大量のデータを使用してシステムをトレーニングし、マシンに自律的に学習、思考、分析する能力を与えます。チタン・キャピタルは今後も技術の反復に注意を払い、産業界や資本のパートナーとともに技術進歩の機会を捉えていきます。