ニュース

エンドツーエンドのスマート運転: かつては数百万ドルの年収を稼いでいたが、今は失業の不安を抱えている

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

テキスト丨アンキ・リー

編集者丨リー・チン

「エンドツーエンドを採用するか、数年以内にスマート運転業界から撤退するかのどちらかです。」

スマート運転業界に参入して数年が経ち、スマート運転エンジニアの Qin Feng (仮名) は、すでにスマート運転業界の急速な進化に適応しています。しかし、新しいテクノロジー「エンドツーエンドの大型モデル」が登場したとき、最初に影響を受けるのは人間のドライバーではなく、エンジニアである自分自身かもしれないと感じています。

この種の不安は秦峰氏に限ったものではない。多くのスマート ドライビング エンジニアは、新しいテクノロジーを学ぶために、残業中に業界の最新論文を読んだり、Bilibili に行って講義を受けたり、大学院の教科書から学び始めた人もいると 36Kr に語った。

「エンドツーエンド大型モデル」は、今年のインテリジェント運転業界における最新技術爆弾です。

テスラは今年1月、FSD(自動運転ソフトウェアパッケージ)v12のテスト版を一般ユーザー向けに正式に提供開始した。このバージョンではエンドツーエンドのネットワーク ソリューションが採用されており、多くのユーザーは、以前の v11 バージョンよりもはるかに使いやすいエクスペリエンスになったと評価しています。

マスク氏はかつて、エンドツーエンドの機能を「画像の入力、制御の出力」と呼んで導入しました。多くの業界関係者は 36Kr に対し、テスラのエンドツーエンド ソリューションが実用レベルでそれほど急進的で魔法的なものであるとは信じていないと表明しましたが、エンドツーエンド ソリューションは依然として国内の同業他社を蜂蜜のように駆り立てています。国内企業は、大規模なモデル、大規模なコンピューティング能力、大量のデータによって、AI システムは人間と同じように運転できると徐々に信じています。

新しい技術トレンドを察知して、国内の自動車会社やスマート運転の大手企業はすでに行動を起こしています。ファーウェイ、NIO、BYDなどの大手企業は、エンドツーエンドのソリューションを推進するためにチームとリソースを投資しており、アイデアルとNIOの自動車会社2社も、テクノロジーの実装を促進するために、エンドツーエンドの大規模モデル専用部門を設立しています。もっと早く。 。

ハイエンドの人材をめぐる競争も、公然、密かに激化している。最初の自動車が市場に投入されたとき、スマート運転の進歩に追いつくために、Xiaomi Motors は元ツーソンチャイナ CTO の Wang Naiyan 氏を入社に採用しました。スマート運転業界の一部の関係者は、ファーウェイ・スマート・ドライビングが人材を確保し、ターゲットを絞ったマイニングを行うために関連特許も使用していると36Krに語った。

新しい計画は確かに国内市場に火をつけている。しかし、このコインの裏返しとして、エンドツーエンドは多数のエンジニアによる手作業の積み重ねではなく、データ駆動型の実装に大きく依存しているということです。テスラのチーム規模約 300 人をモデルとして、有力企業に広めています。

しかし、業界の現実は、現在の大手企業のスマート ドライビング チームには 1,000 人近くの才能があるということです。スマート運転に追いつきつつある老舗自動車会社のBYDは3,000人のソフトウェアチームを擁しており、ファーウェイのスマート運転チームもそれに遠く及ばない。市場が良好な場合、エンジニアは通常、年間数百万ドル相当の給与パッケージを受け取ることができます。

しかし、多くのスマートドライビングエンジニアは、エンドツーエンドソリューションの効果がさらに検証されれば、自動車会社のスマートドライビングチームの人員削減が高確率で起こるだろうと考えている。

「200 ~ 300 人の従業員は必要ありません」と、新しい動力自動車会社のスマート ドライビングの元中心人物は 36 クリプトンにきっぱりと言いました。深層学習のバックグラウンドを持つ新卒者であっても、エンドツーエンドのプロジェクトに参入する一部のスマート ドライビング エンジニアよりも有利な場合があります。

スマートドライビングのヘッドハンターの中には、業界が人材で溢れていることを明らかに感じている人もいる。自動車会社のスマートドライビングチームはもはや新たなポジションを解放せず、「最新のニュースでは、多くのHCがゾンビポジションになっている」と人員が整理され始めている。彼はヘッドハンターから転向し、ロボット企業の人材採用に転向しました。

エンジニアがドアの外で立ち往生

インテリジェント運転エンジニアのティアン・ウェイ氏(仮名)は、この新たな技術革命では、知覚モジュールや予測モジュールよりも計画・制御モジュールのエンジニアの方が大きな影響を受けるだろうと36Krに語った。

これは主に、エンドツーエンドのソリューションが従来のスマート運転ソリューションとは大きく異なるためです。従来のソリューションは、認識、測位、マップ、予測、計画制御などの複数のモジュールに分割されており、モジュール機能の実装は基本的にエンジニアのコードによって駆動されます。認識、計画、制御という 2 つの主要部門の担当者がインテリジェント運転チームの大部分を占めることがよくあります。

ただし、エンドツーエンド ソリューションの特徴は、エンジニアによるコード駆動からデータ駆動に変化することです。最も理想的な方法は、システムに画像を入力し、システムが車両制御を直接出力でき、中間リンクは AI ニューラル ネットワークによって完成されます。

国内の大手企業の進歩から判断すると、エンドツーエンド ソリューションの導入後、従来のソリューションの複数のモジュールが AI ニューラル ネットワークを通じて変換され、大規模な認識モデルと大規模な予測という 2 つの大きなネットワークに統合されています。そして意思決定モデル。 「現在のソリューションの多くは大規模な認識モデルに基づいており、大規模な予測計画モデルに接続されています。」

さらなるソリューションでは、認識、予測、意思決定、計画が統合され、業界ではこれを「ワン モデル」と呼んでいます。

新しい技術ルートには、自動車会社のスマートドライビングチームのための新しい人材プロフィールも含まれています。

インテリジェントな運転担当者は 36Kr に対し、エンドツーエンドのチームに必要な人材は少なくなっているが、人材の基準要件は高くなっていると語った。大規模なモデル自体は、チームに強力なディープラーニングの背景を必要とします。「プロジェクト構築段階では、強力なインフラストラクチャの才能、認識、計画、制御の各モジュールの深い理解、およびさまざまな理解も必要です。」チップ コンピューティング プラットフォームのサポート、さまざまな AI 推論フレームワークなど。

ただし、モデルの構築とトレーニングを担当する人の数はほんの一部にすぎません。 「おそらくチームの 90% がエンドツーエンドのデータと、データのクローズドループ ツール チェーンのサポートなどを提供しています。」

「ビッグモデル自体は非常に有能なチームだ」と賢明な人物は語った。 OpenAI などの AI テクノロジー企業が初期の頃は 200 ~ 300 人しか従業員を抱えていなかったにもかかわらず、大規模な言語モデル ChatGPT を立ち上げ、世界的な AI プロセスを変えることができたのはこのためです。

エンジニアにとって、エンドツーエンドテクノロジーの影響も様々です。

インテリジェント運転の専門家は36Krに対し、知覚と制御の2つのモジュールのうち、大規模な知覚モデルはもともとディープラーニング技術に依存していたと語った。目視検査のルートはこれまでのCNN畳み込みニューラルネットワークからTransformerベースのBEVへと移行したが、エンジニアへの影響は大きくなかった。

しかし、規制エンジニアにとって、エンドツーエンドに参加したい場合は、ほぼ再び軌道を切り替える必要があります。インテリジェント運転の専門家は 36Kr に対し、従来の規制および制御エンジニアは主に、経路予測、経路の最適化、ルールの後処理、車両制御などのいくつかの方向に焦点を当てていると語った。 「それらはすべて非常に細分化された主題であり、基本的には無関係です。経路予測モジュールを除いて、他の分野のエンジニアには基本的に深層学習の背景がありません。」

インテリジェント運転エンジニアのティアン・ウェイ氏は36Krに対し、規制当局がエンドツーエンドに切り替えたい場合、1つの方向性はモデルトレーニングそのものだが、これには強力なディープラーニングの背景が必要だと語った。 「深層学習を研究している新卒の方があなたよりもモデルをよく理解している可能性があります。」

2 番目に、エンドツーエンドのデータ栄養を提供するためのデータ マイニングと処理です。 「しかし、ツールチェーンのインフラストラクチャが完成し、モデルの構造が安定すれば、人はもう必要なくなるかもしれません。最後に、エンドツーエンドの大規模モデルによって出力される軌跡は信頼できません。」を作成するには少数のエンジニアが必要です。ルールは明確です。

エンジニアもこれを懸念しています。 「一方で、エンドツーエンドの大型モデル自体はそれほど多くの人員を必要としません。一方で、誰もがエンドツーエンドでやりたいと考えていますが、同社の量産ビジネスにはそれを実行する人が必要です。」

Zhijia の従業員も、同社の現在の量産プロジェクトのせいで、エンドツーエンドのプロジェクト チームに参加する機会を逃したことに腹を立てていました。しかし、彼は非常に複雑でもあります。たとえ彼がエンドツーエンドのソリューションに参入したとしても、それは新しいソリューションをサポートするためですが、これは大規模なモデル自体の中核的な立場ではありません。

そして、現在の量産プロジェクトのポジションに留まれば、スマートドライビングの量産プロジェクトで完全な経験を積むことができ、数年以内に従来の自動車会社に異動することもできます。

しかし、エンドツーエンドのソリューションが業界全体に普及すると、彼が長年蓄積してきた技術スタックも数年後には消滅するリスクに直面することになるだろう。 「私はスマートドライビング業界から離れなければならないかもしれない。」

テクノロジー部門、リソースゲーム

エンドツーエンドのプロジェクト チームに移行するために、エンジニアの Tian Wei は深層学習の大学院コースから直接スタートしました。

彼はディープ ラーニングとグラフィックス カードに関する古典的なコースを見つけ、教科書の実践コースを使用していくつかの簡単な画像認識アルゴリズムを実装しました。 「少なくとも、モデル自体がどのように機能するかを理解する前に、まず知識ポイントを徹底的に理解する必要があります。」

2 か月間読んで練習した後、Tian Wei はついに、エンドツーエンドの大規模モデルのオープン ソース コードを理解できるようになったと感じました。 彼は会社にエンドツーエンドのプロジェクトチームへの異動を申請しました。

実際、Tian Wei だけが不安を抱えているのではなく、Tian Wei が働いているスマート ドライビング会社は彼よりもさらに不安を感じています。同氏は36Krに対し、自社はスマート運転向けの量産ソリューションを開発するために自動車会社と協力しているが、自動車会社内にはエンドツーエンドで推進しているチームもある、と語った。すでにエンドツーエンド計画を開始しています。」

Tian Wei 氏は、同社の理解によれば、エンドツーエンドのデモはわずか 2,000 時間のビデオ データでトレーニングでき、このレベルのデータは 50 台の車両を使用して 1 ~ 2 か月で完了できると述べました。

しかし、Tian Wei は、会社の既存のリソースでは、ソリューションの実現可能性を証明するためのエンドツーエンドのデモのトレーニングしかサポートできないことをよく知っています。デモと量産の間にはまだ大きなギャップがあります。

この新しいテクノロジー部門のゲームは、まずリソース部門に反映されます。

Tesla の CEO である Musk 氏はかつて、エンドツーエンドのデータの重要性を強調しました。「100 万件のビデオ ケースを使ったトレーニングではかろうじて十分です。200 万件あればもう少し良くなります。300 万件に達すると、すごいと感じるでしょう。」 1000万なんて信じられない金額だよ。」

一方、コンピューティング リソースもあり、マスク氏は NVIDIA グラフィックス カードのトレーニング用も購入しており、年末までに人工知能トレーニング用のコンピューティング パワーは 90,000 個の NVIDIA H100 に相当すると述べています。コンピューティング能力の余力と需要は驚異的です。

この閾値はかなり高いです。依然として収益を上げるのに苦労しているスマート ドライビング会社にとって、自動車会社と協力していないため、スマート ドライビング会社が独自にトレーニング データを収集することは困難である一方で、クラウド トレーニング チップは困難です。中国では多くの自動車会社がそれらを高値で買収している。 「量産プロジェクトや資金調達はまだ不透明で、エンドツーエンドの長期投資は難しい」と述べた。

別の賢明な運転エンジニアも無力感を感じていました。半年足らずでエンドツーエンドのプロジェクトを開発した後、彼は会社からエンドツーエンドのプロジェクトを中止する通知を受け取りました。その理由は、同社が現在の都市マップレススマート運転ソリューションの開発にエネルギーとリソースを集中する必要があるためで、これは「エンドツーエンドであまりにも多くのリソースを消費する」からだ。

エンジニアが感じたのは、彼のチームが作成したエンドツーエンドのデモの準備ができていたのに残念でした。チームは当初、テスラの FSD のベンチマークを目標としており、ツールチェーンやその他のインフラストラクチャの構築にも多大な労力を費やしました。しかし、同社のエンドツーエンド戦略の中止により、チームの研究開発の焦点はロボット工学の分野に移った。

このエンドツーエンドの新技術はまだ中国では実際には導入されていないが、スマート運転業界の人材構造と生態構造の再構築にその影響が現れ始めている。

それにも関わらず、有力プレイヤーはこの破壊的な列車に乗ろうと全力を尽くし、データリソース、チップリソース、人材リソースを支配する巨人の時代が到来するでしょう。

(記事中のQin FengとTian Weiは仮名です。)