ニュース

Luobo Kuaipao の人気の後、AI スマート運転時代には数千億人が起業の機会を追跡

2024-08-09

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

出典:ビジュアルチャイナ

寄稿者丨Xu Zhen、Xianfeng Evergreenの投資家

編集者丨シュエ・ファン

Shenwang・Tencent News Xiaoman Studio が制作

一夜にして自動運転が急速に普及しました。

7月には百度の自動運転タクシー「羅伯快報」が武漢で大規模に展開され、ほぼ毎日ニュースとなった。

報告によると、ルオボ クアイパオの 1 日のピーク時の乗車数は 20 台を超え、これは 1 日の平均タクシー数と同程度であり、乗客のエクスペリエンスはより良く、より快適です。保険データによると、キャロットランの事故率は人間の1/14に過ぎず、大きな死傷者も出ずに1億キロ以上を安全に走行できたという。

海の向こうでは、マスク氏も8月に発売すると発表したテスラ初の自動運転タクシー「ロボタクシー」(その後10月に延期)については、車の所有者が自由な時間にロボタクシーをレンタル事業に投入でき、車の購入費は2年以内に回収できると同氏は述べた。

偶然にも、Google は 7 月 23 日、「世界をリードする自動運転企業としての Waymo の地位を維持する」ために、Waymo に新たに 50 億米ドルの巨額投資を追加すると発表しました。 OpenAIの50億米ドルは、Waymoのこれまでの資金調達総額に近い。

実際、今日の自動運転車の急増は偶然ではありません。業界の観点から見ると、過去 3 年間は自動運転技術の開発において最速の 3 年間でもあり、ほぼ「1 日あたり数千マイル」と言えるでしょう。

中国と米国の現在の進捗状況から判断すると、立法基準と時間の制約を脇に置けば、自動運転は今後 1 ~ 2 年で完全に商用化され、2015 年にはエンドツーエンドの「完成」に達する可能性があります。 5~10年かけて、SF映画のような無人運転の実現。

この観点から見ると、自動運転の「iPhone 4の瞬間」について語るのは時期尚早かもしれないが、自動運転時代のシンギュラリティは確かに到来している。

同時に、これは時間との闘いでもある。中国と米国は世界で最も多くの自動運転企業を擁する二国であり、どちらが主導権を握って関連産業チェーンの構築を進められるかということになる。トラックを定義し、それを他の国に紹介する機会。技術製品を輸出する国の能力。

中国と米国の技術競争を背景に、これは双方にとって「絶対に負けられない戦い」だ。

この記事では、自動運転の開発の歴史から始めて、業界の今後の開発動向を推測してみます。まず、暫定的な結論をいくつか共有しましょう。

1. 高精度地図、LIDAR から BEV まで、自動運転の進化におけるすべての道は、「車をより人間らしく動作させる」ことです。

2. 過去 3 年間は、自動運転技術が最も急速に発展した年でもありました。国内外の多くの企業が、程度の差こそあれ、エンドツーエンドの技術を実現するのは時間の問題です。最終的に究極のエンドツーエンドの形式に到達する前に。

3. 純粋なビジョンであろうとライダールートであろうと、ミリ波レーダーはその 2 つの技術的欠点を補う最良の方法です。ミリ波レーダーが 3D から 4D に移行するにつれて、精度も向上します。このトラックには、価値の高い企業を生み出す機会があります。

4. 自動運転の実装と商業化は単なる始まりに過ぎず、将来的には、十分なデータが蓄積された後、さらに多くのトラックや製品 (さまざまなシナリオのロボットなど) が同様のストーリーを繰り返す可能性があります。

5. 歴史を通じて、テクノロジーの道が繰り返されるたびに、多くの新興企業が台頭する機会があり、今回も例外ではないと私は信じています。

過去 3 年間が自動運転の開発において最速の 3 年間だったと言われるのはなぜですか?

自動運転の起源が認められたのは 2004 年です。当時、米国はアフガニスタンとイラクでの戦争で深刻な泥沼にはまっていたため、米軍の死傷者を減らすために大量の軍用無人車両が緊急に必要でしたが、研究と開発の進捗は決して理想的なものではありませんでした。

その結果、当時米国国防高等研究計画局(DARPA)の長官だったトニー・テッサー氏が思いつき、挑戦を開始し、無人運転方法を使えば誰でもロサンゼルスからロサンゼルスまで飛行できると発表した。 10 時間以内にラスベガスに到着し、賞金 100 万ドルを獲得します。

これは実際には米軍による民間人向けの大規模な入札であり、主催者は当初参加者は少ないと考えていたが、残念ながら最終的には 100 チーム以上が参加することができなかった。最も遠い参加車両は、レース全距離の約 5% に相当する 12 キロメートルしか走行しませんでした。


(写真:車だけでなく自動運転のバイクもあった…)

しかし、DARPA は諦めず、2005 年から 2007 年にかけて 3 回連続で自動運転チャレンジを開催し、多くの大学や企業の研究チームが参加するようになりました。これにより、Google の創設者の 1 人であるラリー ペイジも自動運転の可能性に気づくことができました。 . 駆動力。

2009 年、ペイジ氏の主導により、Google の自動運転プロジェクト「Chauffeur」が正式に開始されました。採用された 2 人のコア エンジニア (アンソニー レヴァンドフスキー氏とセバスティアン スラン氏) は、どちらも元 DARPA 職員であり、後に Google の自動運転プロジェクトの創設者となりました。駆動ユニット。

2014 年までに、Google はハンドルとアクセル ペダルのない世界初の完全自動運転車 Firefly をリリースしました。これは自動車業界に衝撃を与えただけでなく、自動運転の可能性を世界に初めて認識させました。


(写真:Googleが開発した第一世代の自動運転車「Firefly」)

その直後、ウーバー、エヌビディア、アマゾンからバイドゥ、ディディ、ファーウェイ、そしてその後、無人トラックに大量のベンチャーキャピタルが注ぎ込まれ始めた。ベンツBMW、 一般的な、ホンダ、国内の新興自動車メーカーを含む多くの企業が自動運転の研究開発に投資を開始しており、今日私たちが知っている自動運転企業のほとんどは当時設立されました。

あっという間に 2 年が経ち、自動運転業界にとって、2016 年は非常に重要な年となりました。なぜなら、今年、テスラが正式にこの戦いに加わったからです。

と言っても過言ではありません。2016 年を区切りとして、自動運転の後半全体は、業界の追撃者からリーダーへのテスラの逆襲の歴史です。したがって、個人的には、この瞬間をあまり誇張することはできないと感じています。

2016 年以前は、ほぼすべての自動運転企業が Google の技術ソリューションを選択していました。

1) 測位: 高精度マップによる測位支援。

2) 知覚: LIDAR + ビジョンカメラを使用して車両の知覚情報を提供します。

3) 規制と制御: ルールベースのアルゴリズムに基づく意思決定と制御。

Google のソリューションの基礎となるロジックが、いわゆる「積み重ねられた鎧」であることを見つけるのは難しくありません。「何もないよりは何かがあり、少ないよりは多い方が良い。」

この考え方では、現在の技術レベルでは、単一のセンサーで自動運転に必要なすべての機能を完了したり、すべてのコーナーケースをカバーしたりすることはできないため、すべてのセンサーを使用して自動運転の意思決定を包括的に行い、さまざまな機能を割り当てる必要があると考えています。さまざまなセンサーに機能するため、その中で最も重要度が高いのは LIDAR であるため、このグループのソリューションはとも呼ばれます。「LiDARソリューション」;本質的に、これはハードウェアベースの技術的なルートです。

AI から始まったテクノロジー企業として、テスラはより多くのソフトウェアを重視しています。たとえば、マスク氏は、当時の LIDAR は 1 台あたり 8 万ドルもして高価すぎると感じたため、強力なビジュアル アルゴリズムと専用 AI の開発に重点を置きました。チップはカメラの助けを借りて周囲の物体のモデルを構築し、計算のためにニューラルネットワークにデータを追加しようとし、ゆっくりと開発します「純粋に視覚的なソリューション」これはソフトウェア指向のテクノロジー パスです。

マスク氏自身の言葉を借りれば、「人間も動物もレーダーではなく目がある」と運命の歯車が回り始めた。

当時、2 つの技術的なルートにはそれぞれ利点がありました。LIDAR はハードウェアのコストが高かったものの、本質的に正確で深度情報を備えていました (今日に至るまで、多くのエンジニアは依然として LIDAR に注目しています)。一方、カメラは安価ではありますが、解像度が低いため、二次元世界の物体の片側の情報を比較することしかできません。計算や変換によって得られる情報は、常に直接の情報ほど正確で直観的ではありません。

これにより、テスラは一度に数千人からなる独自のラベル付けチームを構築することになったため、当時多くの人がマスク氏に疑問を抱き、ハードウェアは安価だったものの、全体のコストはライダーほど良くなかったと述べました。

実際、ここからも当時の自動運転全体のAIレベルは(一部のAIアルゴリズムを備えたLIDARを除いて)ほとんど存在しなかったことが分かります。典型的な「知能の数だけ人工知能がある」のですが、AI の開発がここで停止した場合、テスラの純粋なビジョン ソリューションはボトルネックに遭遇する可能性が高くなります。

しかし、最終的にテスラを救ったのは Google でした。

2019 年、Google は有名な Transformer 論文を発表しました (これはその後の大規模モデルの基礎でもありました)。

Transformer はアテンション メカニズムに基づいたニューラル ネットワーク モデルですが、Tesla のエンジニアは、Transformer が言語情報を処理できるだけでなく、画像情報の処理にも使用できることをすぐに発見しました。

つまり、Transformer は、テスラの 8 台のカメラによって収集された情報を同じ位置座標系に統合できます。それは車に「神の視点」(つまりBEV、「鳥瞰図」)を与えることに相当します。周囲の環境情報を3Dで見ることができます。


(写真:BEV技術がテスラに「神の視点」を与える)

2021年のAIデーに、テスラはBEVを発売し、普及に成功した。2022年後半からは、国内企業も後追いを発表し、徐々にBEVを搭載し始めた。

(つまり、多くのテクノロジーはテスラ独自のものではありませんが、最先端の探査から高度な理論を設計し、それらを実用化する能力は間違いなく宇宙レベルにあります。)

同時に、テスラはコストが高すぎるという問題を解決するために、ラベル貼り付けプロセスを可能な限り自動化する試みも始めた。

その原理は、茶番劇に似ています。まず、オンボード カメラがオブジェクト (木など) を認識した後、その情報をクラウド内の大きなモデルにアップロードし、その後、大きなモデルが何を「推測」します。オブジェクトは何ですか?推測された結果が 8 つのセンサー表現と一致する場合、ツリーには自動的にラベルが付けられます。

このようにして、テスラは人的資源の制限を取り除き、車両が道路情報を継続的に送信できる限り、独自のアルゴリズムを無制限にトレーニングできます。

これまでのところ、テスラのパフォーマンスは十分に驚異的でしたが、わずか 1 年後、マスクは AI デーで 2 つの大きな動きを行いました。1 つ目は時空シーケンスの導入で、2 つ目は占有ネットワークの導入でした。

簡単に言えば、前者は車に時間を記憶させる機能を持たせ、後者は「疑似ライダー」に似た効果を実現します。物体が何であるかを特定することなく、車が空間位置を計算し、障害物回避が必要かどうかを判断できるようにすることで、「白い大型トラックに衝突する」という以前の問題が解決されます。

これまでのところ、視覚的ソリューションは経路に関係なく、効果という点ではレーダー ソリューションと基本的に同じ効果を達成しています。BEV+Transformer は自動運転知覚技術の経路収束に成功し、今日の視覚知覚アルゴリズムの基本フレームワークを形成しました。


(写真:ネットワークを占有することで「擬似ライダー」と同様の効果が得られる)

したがって、全体的な傾向としては、自動運転の進化の道筋は実際には非常に明確です。すべての目的は、車をより人間のように動作させることです。過去に起こったことに基づいて、将来何が起こるかを AI に予測させます。

この観点から見ると、過去 3 年間は自動運転技術が最も急速に発展してきた年であり、AI は自動運転における強力なアップグレードと反復能力を徐々に示してきました。しかし、当時のほとんどの一般人はこれについてあまり知らず、考えていました。自動運転はほとんど進んでいない。

AI が自動運転業界に革命的な影響を与えるということを実際に一般の人々に認識させたのは、2023 年に起こったいくつかの出来事です。

・マスク氏はソーシャルプラットフォームで初めて「v12はFSDがエンドツーエンドAIの場合のために予約されている」と言及し、エンドツーエンドが注目を集めた(NVIDIAは2016年に提案したが、影響力はほとんどなかった)。数え切れないほどの人が v12 のリリースを楽しみにしています。

・過去10年間で初めて、CVPRは中国のチームに最優秀論文を授与し、エンドツーエンドの自動運転の実現への貢献を称賛した。

・マスク氏はv12ベータ版を搭載したモデルSで45分間のライブブロードキャストを実施したが、全過程で介入したのは1回のみで、その効果は非常に良好と言える。

ただし、テスラが展示した v12 が完全なエンドツーエンドのパフォーマンスを達成したという直接的な証拠は現時点ではないことを明確にする必要があります。しかし、その展示の効果​​は確かに驚くべきものであり、そのインテリジェンスのレベルは基本的に同等です。経験豊富な人間のドライバーの運転に。

実際、従来の理解に従って自動運転システムを知覚、計画、制御に分けると、現在、大手 OEM が自社の強みを誇示するために主に使用しているのは、部分的な AI+ 基本ルール制約を備えたモジュール式のエンドツーエンドです。

各モジュールには人間が定義したインターフェイスが必要であるため、その過程で一部の情報が失われます。そのため、モジュールが増えれば増えるほど、より多くの情報が失われます。大手メーカーは、今後、すべてのモジュールを 1 つのモデルに統合する方法を検討する必要があります。すべてのモジュールを 1 つのモデルに統合する方法については、引き続き努力する必要があります。

しかし、私たちが収集した情報によると、現在の技術とエンジニアリングの発展速度によると、自動運転が最終的にエンドツーエンドで実現されるのは時間の問題です。私の比較的保守的な予測では、まだ 3 ~ 5 年の蓄積が必要です。

その際、車両はリアルタイムに収集された道路情報に基づいて「ブラックボックス」状態で運転判断を完了し、ブレーキやステアリングなどの制御信号を直接出力することで、SFのような究極の無人運転を実現します。映画。


(写真: 自動運転の 5 つの開発段階、出典: Xianfeng Evergreen)

自動運転の反復によってもたらされるベンチャーキャピタルの機会

なぜ今、無人運転が蔓延しているのでしょうか?私たちが感じている自動運転の「飛躍的」な発展は、本質的には、このAIブームの波を背景としたモデルベースからラーニングベースへのパラダイムシフトの具体的な現れの一つに過ぎないのですが、なぜそれが起こり得るのでしょうか。一番先に起きますか?

理由は非常に複雑です。ここで私が考える重要な要素を 3 つだけ説明します。

まず、データが比較的豊富です。

周知のとおり、国内の自動運転業界は 2015 年頃から需要が高まり始め、この期間に OEM やスマート ドライビング企業が収集したデータが普及してからほぼ 10 年が経ちました。品質に関係なく、少なくとも全体としては十分に豊富であり、後でデータ閉ループを実現するための基本的な条件を作成します。

2 番目に、関数の定義が比較的明確で明確です。

率直に言って、この AI の波のコンセプトは非常に熱いものですが、多くの製品の開発方向性は実際には不透明です。

例えば、人型ロボットに関しては、多くの企業が展示会でデモンストレーションできる程度のプロトタイプしか作っていないが、実際の産業現場では、これらのロボットがどのような課題をどの程度解決できるのか、上流技術側には明らかではない。彼らはそれを達成することができます。

下流の工場はAIを理解していないため、ロボットがどのような機能を実現できるのか、他の技術と組み合わせることができるのかが分からないことが多く、双方の理解を深めていくだけでも時間がかかります。

しかし、無人運転では、車両は前進、後進、旋回、加速、ブレーキという基本的な動作をすべてカバーできれば十分です。要件はシンプルかつ明確です。

したがって、高度な技術を使いやすい製品に変えるためには、明確な機能定義や規格区分も重要な要素となります。

第三に、ハードウェア基盤は比較的成熟しています。

レーザー、カメラ、ミリ波などのセンサーソリューションも、信号の伝送や処理を行う各種チップも、10年の本格的な「進化」を経て、基本的には高コストパフォーマンス+安定供給の段階に入りました。

したがって、データ、ハードウェア、テクノロジーのスパイラルプロセスの中で、自動運転は最初に価格とエクスペリエンスのバランスポイントに到達し、すぐに新しい生産性を形成しました。

したがって、このロジックをさらに一歩進めれば、自動運転はおそらく始まりにすぎず、将来的にはより多くのトラックで同様の話が繰り返される可能性があります。

もちろん、一部の企業に依存するのではなく、この分野で大量のデータを低コストで収集し続けることができる企業(自動運転分野の滴滴、百度、テスラなど)が存在することが前提です。散在する小さなデータは、特定の業界が同様の転換点を経験したかどうかを判断するための基礎となる可能性があります。

別の観点から見ると、このような大型モデルの波の台頭により、将来的には、AIによる自動化が可能だが大企業がまだ取り組んでいない細分化された多くの分野(低高度経済など)に計画的な投資機会が生まれる可能性があります。工業製造業など)、数百億、さらには数千億の価値があるテクノロジー上場企業が隠れており、これらも投資家の注目に値します。

自動運転に他に投資できるものは何でしょうか?少し話がそれましたが、考えを戻して自動運転そのものについて話しましょう。実際、歴史を通じて、自動運転技術が繰り返されるたびに、多くの新興企業が台頭する機会が生まれてきました。

たとえば、Google 時代の主流のソリューションはライダー + カメラ + 高精度地図でしたが、現在では乗用車で高精度地図が使用されることはますます少なくなり、言及されることさえなくなりました (考えてみてください。 2年前)の件)。

当時、地図収集車両のコストだけでも数百万ドルだったため、リアルタイムのパフォーマンスを可能な限り確保するには、少なくとも数百台の車両が毎日同時に道路を走行する必要がありました。全国地図のリアルタイム収集と更新を実現することは、自動車会社も地図ベンダーも不可能でした。

その結果、産業上のチャンスは最終的に LIDAR に当てられることになります。

1 つ目は Hesa​​i などのハードウェア メーカーの台頭です。サジタルその後、LiDAR を中心としたアルゴリズムを構築する Wenyuan、Pony、Vimo などの企業グループが出現し、続いてレーダー + クローズド ベースの小規模な閉ループ L4 レベルの自動運転アプリケーションを試し始めた起業家グループが現れました。 、鉱山の無人車両、港の無人車両、ホテルの配食ロボットなどが登場し、自動運転エコシステム全体が徐々に開花し始めています。

しかし、テスラは BEV+Transformer で再び業界をひっくり返し、レーダーがなくても 3D 空間を判断できることを証明しました。この時点で、LIDAR はその年の高精度地図と同じになり、必須のオプションではなくなります。

もちろん、現在、LIDAR の価格は千元レベルまで下落しており、今後も下落し続ける可能性があるため、短期的には、一部の自動車会社は引き続きマルチセンサー フュージョン ソリューションを採用するでしょう。

しかし、コスト削減の論理に基づいて、OEM が「すべてのペニーを極限まで追求する」現在、将来的にはライダーは徐々に純粋な視覚ソリューションに置き換えられ、それに応じて産業の生態学的パターン全体が必然的に変化するでしょう。

例えば、従来のミリ波レーダーでは平面情報しか取得できませんでしたが、高さ情報も検出できる次世代の4Dミリ波レーダーの方向性が見えてきました。チップ企業の複数のチップを伴うカスケードおよび SoC ソリューションは、産業需要レベルでの高精度かつ低コストのソリューションへの道を開き、OEM は国産の独立した制御可能なソリューションに熱心に取り組んでいます。製品の安全性や冗長性の要件などが改善されています。

つまり、さまざまな需要に後押しされて、このカテゴリーに新規参入者が現れる可能性があります。

別の例として、カメラによって収集される情報がますます増え、その品質がますます高くなるにつれて、スーパーコンピューティング センターや、次世代のエンドサイド チップを含む大きな計算能力を備えたエンドサイド処理チップに対する需要が生じています。これは、コンピューティング能力を積み重ねることだけではなく、さまざまなアルゴリズム アーキテクチャを組み合わせて、この 2 つをより適切に適応させることも重要です。これらはすべて、ハードウェア側によってもたらされる新しい変更です。

ソフト面では、低コスト+高品質+持続可能なデータ取得・生成手法に注力していきます。

エンドツーエンドのルートでは、学習ベースのアルゴリズムがデータを燃料として使用しているのは事実です。たとえば、Tesla の V12 は「10,000 台の H100 を使用し、約 1,000 万回のビデオ トレーニングを完了した」ことが明らかになりました。

「これらのビデオは、データを収集できる世界中の 200 万台の実際の車両から毎日収集された 1,600 億フレームのビデオから作成されています。これらのビデオのうち利用できるのは 1% 未満です。たとえば、奇妙な、異常に混雑した交差点のデータなどです。」

新しいことに挑戦する最初の人物として、マスク氏はすでに十分な解答用紙を業界に提出しているため、次のステップはシャドウ モード、シミュレーション エンジン、またはワールド モデルを通じて高品質のデータを取得することであるようです。これは、コンセンサスを得るために検討する必要がある業界の次の問題になります。

しかし、これはもはや、あるつながりにある企業だけで決めることはできないと思います。技術的なルートは確かに重要ですが、産業上の位置付けやビジネスモデルは、現在の環境で中国企業がしなければならない事前の考え方かもしれません。

全体として、ハイエンドのインテリジェント運転の実装が徐々にアップグレードされるにつれて、認識、伝達、意思決定、実行、および対話において、いくつかの新しい業界の機会が必然的に生まれます。

たとえば、私は最近、自動車業界の何人かの創業者とコミュニケーションをとりましたが、彼らはそれぞれの本業に加えて、いくつかの分野を超えた応用技術や製品にも注目していることがわかりました。彼らの製品、潜在的な友人やパートナー。

これは、業界内の競争が一定のレベルに達すると、規模拡大+サプライチェーン改善だけでは十分な利益率を獲得することが難しい場合、企業は新技術で新たなブレークスルーポイントを模索する必要があり、その終焉には技術開発に頼らざるを得ません。

スペースの都合上、AI インテリジェント運転時代の起業家としてのチャンスを垣間見るために、記事の最後に表をまとめただけですが、これがあなたに別の考え方をもたらすことを願っています。


(写真: 自動運転のさまざまな段階によってもたらされる産業の変化と機会、出典: Xianfeng Evergreen)

(この記事の著者である徐鎮氏は、咸豊の常緑の投資家です。彼は中核部品、半導体、材料などを含む新エネルギー車産業チェーンに焦点を当てており、かつて咸豊を代表して華神瑞麗に投資していました。浙江大学朱克鎮学院およびワーウィックビジネススクールを卒業。)