ニュース

侯暁迪、慎重な勇敢な男

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


今は自動運転業界で競争する時ではありません。


テキスト | ティアン・シーチー
記事元|Jia Zi Guangnian (ID: jazzyear)

テスラが第2四半期の財務報告を発表するのと同時に、マスク氏はロボタクシー製品の発売を8月初旬から10月初旬に延期すると正式に発表した。マスク氏と同じくテキサスにビジネスを根付かせている侯暁迪氏は、自身が「預言者」であることを改めて確認した。

以前、侯暁迪氏は、彼が共同設立した「最初の自動運転会社」である TuSimple との信頼から疑惑、協力から離別までの道のりで最もよく知られていました。

2021年4月に上場後、侯暁迪氏の純資産は一時10億米ドルを超えた。しかし、対米外国投資委員会(CIFUS)による調査と監督の開始により、ツーソンは混乱に満ちた経営陣の交代を経験した。 Hou Xiaodi氏は最初にCTOの地位からCEOに昇格し、2022年10月に取締役会によって解任され、その後10日後に彼と別の共同創設者がスーパー投票によって元取締役会を解任したが、彼は解任されなかった。 2023年3月、侯暁迪氏はついにツーソンからの完全退職を発表した。

2024年2月の上場廃止を前に、ツーソンの株価も80ドル近い高値から1ドル未満まで急落した。

ホウ・シャオディとツーソンの関係は、かつてのマンハッタン計画におけるオッペンハイマーの役割に似ているという人もいる。戦後、オッペンハイマー氏があらゆる方面からの疑惑と監視に直面しなければならなかったのと同じように、ツーソン・フューチャーでの侯暁迪氏の決断と行動は常に拡大鏡の下に置かれており、彼の選択はすべて物議を醸す可能性がある。

それでも、ホウ・シャオディは依然として誇りを持って「Jiazi Guangnian」に、ツーソンは公道で完全無人大型トラックをテストした世界初の企業であり、無人運転のゲームの前半を達成したと語った。安全冗長システム。

今年5月、CIFUSはツーソンと和解に達した。ツーソンの発表によると、今回の調査では、以前から噂されていた「技術移転」を含め、同社による違反行為は発見されなかったという。ツーソンを去った後、Hou Xiaodi 氏は再び L4 レベルの無人トラックの起業家精神に専念し、米国に新会社 Bot.Auto を設立しました。

世論でL2支援運転がL4無人運転に徐々に取って代わられたとき、侯暁迪はL4の研究開発を主張し、この賢明で勇敢な道を運転した。しかし、彼は主流とは異なる方向性をエキサイティングな機会として捉えています。「毎日 100 点を獲得して優秀な生徒になるか、一生に一度の機会を利用して革命的なビジョンに影響を与えるかのどちらかです。不確実性が高く、業界のコンセンサスも低いですが、もちろん、私たちのチームは独自のスキルを持っており、協力することで、この奇跡を達成できると信じています。」

彼の革新的なビジョンは、Transportation as a Service (TaaS) の概念に基づいて、無人トラックを人間よりも低い 1 キロメートルあたりのコストで運行させ、それによってより多くの社会的価値を生み出すことです。財務的な観点から、夢実現の結節点は当初2026年前半と定められています。

この独占インタビューの中で、侯暁迪氏は、ロボタクシーの延期や国内の「キャロットラン」の撤退などの業界の出来事についてコメントし、「自動運転について世間は多くの批判を抱いている」など、万人を満足させることができない多くの判断を下した。なぜなら、誰もが自分は運転できると思っているからです。」

時代の激流に押し流されて、ホウ・シャオディとトゥシンプルの物語は悲劇的な展開を迎えることになる。これにより、創造と保護は同じように重要であり、保護の方がより難しいことを思い出したため、今回は保護者の役割を選択しました。 「以前は技術的な立場に自分を置きすぎていて、非常に熟練しているということは、すべての欠点をカバーする1人の美しさと同等です」と侯暁迪氏は語った。あらゆる面で会社です。」

以下はインタビュー全体を編集、整理したものです。


ロボタクシーと L4 のセキュリティ上の課題

Jiazi Guangnian: まず最初に、ロボタクシーの延期に関して、あなたが再び真の預言者になったことを祝福したいと思います。

Hou Xiaodi: それなら、みんなもそれに慣れるはずです。私にはたくさんの予測があります。私は以前、スケーリングの法則が答えではないと述べましたが、私はスケーリングの法則には断固反対します。別の例を挙げると、GTC カンファレンスでは誰もが NVIDIA が全能であると感じていましたが、NVIDIA のエッジ コンピューティングのパフォーマンス向上はほぼ限界に達していると感じました。 。

私は人々の熱意に冷や水を浴びせることがよくありますが、これは本質的に、将来の期待に対する私の異なる態度を反映しています。大胆な予測をしたい場合は、楽観的な姿勢を持ってください。ただし、正確な予測が必要な場合は、知識とロジックに基づいてください。中学校の物理を例にとると、民間人は水が石油に変わることや永久機関について話すことができますが、質量とエネルギーの保存について学んでいれば、永久機関について聞くことができます。 。

私にとって、予測を見たときに本当に考えなければならないのは、問題の背後にある理論的裏付けです。将来のテクノロジーの発展傾向は物理法則と数学法則によって制限されます。私たちはこれらの制限を尊重する必要があります。

Jiazi Guangnian: あなたは以前、マスク氏のロボタクシーは製造できないと述べましたが、現在そのリリースが再び延期されており、あなたの発言が部分的に裏付けられます。延期という決定についてどう思いますか?

Hou Xiaodi: ロボタクシーの現在のパフォーマンスは、本物の L4 には程遠いです。数か月前、私の友人が Tesla をとても褒めていたので、Waymo に試乗してみたらどうかと提案しました。その結果、その日彼は私にこう言いました。「Xiaodi、私は Waymo に乗ったことがあります。Tesla は本当にゴミです。」

(注:WaymoはGoogleの親会社であるAlphabetが所有する自動運転会社で、カリフォルニアやテキサスなどで無人タクシーサービスを開始している。)

Robotaxi は、1 つまたは 2 つのバグを修正して 2 か月延期することでリリースされるわけではありません。そこで私は、10月10日になってもRobotaxiが実際にリリースされる時期ではなく、来年になっても適用できる時期ではないと予測し続けています。せいぜい、Robotaxi が実際に今年 10 月にいつリリースされるかについては何の手がかりもありません。

Jiazi Guangnian: Waymo に乗った後、Tesla Robotaxi ができないと感じるのはなぜですか?

Hou Xiaodi: Waymo の行動はより大きな確信を与えてくれます。 FSDの最新バージョンである妻のテスラを試乗したところ、多くの動作ジャンプが非常に厳しく、交通事故の責任を最小限に抑えるという観点から設計されていないことが非常に多くのアルゴリズムで行われていました。貧弱で、実際にはL4レベルではないように感じます。

技術的な本質に加えて、商業的な本質もあります。テスラで FSD を運転中に誰かが死亡したらどうなるかというジョークがあります。私の答えはダジャレです。それは彼らの仕事ではありません。責任分担に関して、テスラはドライバーが全責任を負うと明確に述べています(システムは、FSDを使用するとき、ドライバーは最初から最後までステアリングホイールから手を離さず、道路状況に注意を払い続ける必要があることを明確に示しています)。第二に、これはテスラのビジネスモデルではなく、車を販売することであり、FSDは車の販売の付加価値です。より多くの車を売る方法を検討したい場合、L4 のような限定されたエリアを深く掘り下げて、このエリアのすべてのコーナーケース (極端な状況) を解決することはできません。

Jiazi Guangnian: つまり、その論理は交通事故を最小限に抑えることではなく、テスラの責任を最小限に抑えながらビジネスの利益を最大化することだと考えていますね。

Hou Xiaodi: 1 つ目はテスラの責任を最小限に抑えること、2 つ目はビジネス上の利益を最大化することです。現在、最良のケース(最良のケース)、平均的なケース(平均的なケース)、最悪のケース(最悪のケース)の 3 つのケースがあります。 Tesla は最良のシナリオを最適化します。運転支援自体に価値があるのは、消費者がそれを認識している限り、その使命は達成されたことになる。

Jiazi Guangnian: マスク氏は財務報告会議で規制当局の承認を求める方法について多くの詳細を紹介しなかったが、テスラはいわゆるユニバーサルなソリューションであり、ウェイモのよりローカライズされたソリューションよりも優れている可能性があり、脆弱すぎると常に強調した。 。

侯暁迪: これは典型的な詭弁です。脆弱性をどのように定義しますか?私は世界中を旅することができ、どの都市でも旅行することができますが、それは狭い地域でしかできないため、脆弱になります。しかし、L4 の競争の問題は、この狭い限られたエリアでうまくやれるかどうかでした。その結果、彼は、私はこの点であなたと競争しているのではなく、それについてあなたと競争していると言いました。これは、私と都市の北の徐さんのどちらが美しいかを尋ねるのと同じです。彼は、私が美しいのではなく、都市の北の徐さんがどちらが賢いのかを主張します。あなたより賢くて美しいですか?彼は私が速く走ったとも言いました。とにかく限られた環境で堂々と勝負したくないんです。

オリンピックに長距離走と短距離走の両方に使用できる選手が一人もいないのと同じように、自動運転に使用できる単一の技術は世界中のどこにも存在しません。限られたシーンをやるなら、それをしっかりやりましょう。世界中で車を売りたいなら、車のブランドを構築するのではなく、自分が L2+ であるとだけ言えばよいのです。私はマーケティングを通じて大衆を混乱させるのが好きではありません。騒音が大きければ大きいほど、真面目な人たちに対するプレッシャーが大きくなります。

Jiazi Guangnian: 現時点では、L4 の技術的課題はまだ比較的大きいものですが、具体的にはどのレベルを指しますか?

Hou Xiaodi: 一般的に、それをマスターできる人にとっては難しくありませんが、難しい人にとっては難しくありません。私たちのチームは、他の人が経験した困難を一つ一つ克服し、論文に基づいてさらなる革新と開発を行うことができると思います。

ドライバーレス L4 の核心は、安定したシステムを完成させる方法、特に不安定なモジュールを使用して安定したシステムを完成させる方法です。たとえば、カメラが 1 フレーム内で物体を検出できなかった場合、このようなことは必ず発生します。システムが崩壊しないようにするにはどうすればよいかが鍵となります。

愚かな方法は、システムを安定させるために、10 万キロメートルの故障時間を 100 万キロメートルの故障時間に短縮することです。賢い方法は、アーキテクチャ レベルで革新して、1 つのモジュールに障害が発生しても、他のモジュールでそれをカバーできるようにすることです。システムにいつ障害が発生しても対処できるように、さらにいくつかの層の保護計画を導入しました。民間航空機は典型的な冗長システムです。航空機には通常 2 つのエンジンがあり、機能的に安全で互いに独立するように設計されています。システムのセキュリティは、決して失敗しない単一のエンジンを作成することではなく、より高度なアーキテクチャによって実現されます。

Jiazi Guangnian: それは、安全冗長性の準備です。

Hou Xiaodi: 具体的には、安全性の冗長性をエンジニアリングで実現可能にすることです。現在の技術レベルでは、業界エコシステムが提供する成熟したコンポーネントを使用して安全で冗長なシステムを構築することが自動運転の最も重要なタスクです。

また、L2 から徐々に L4 に発展する可能性があると言う人もいますが、私はこれに同意しません。当社の L4 研究では、時間の 70% を冗長システムに費やしています。 L2 の機能がどんなに優れていても、L4 の機能はせいぜい 3 つまでしか完成できず、残りの 70% の機能には手がつけられていません。 Tesla は L4 企業ではなく L2+ 企業であり、その設計の多くは安全性や冗長性を目的としたものではありません。


サービスとしての交通‍

Jiazi Guangnian: あなたは常に L4 ルートに固執してきましたが、現在、業界と一般の人々は自動運転よりも L2 支援運転について議論しているようです。

Hou Xiaodi: Bot.Auto と私が成功するかどうかは、それが主流かどうかとは何の関係もありません。全員の承認は必要ありませんが、実際に経済的価値、さらには社会的価値を生み出すことができれば、それで十分です。

技術的なルートは客観的な法則によって決定され、ルートの正しさはそれがコンセンサスであるかどうかとはほとんど関係がありません。特に自動運転の分野ではそうだ。自動運転について世間では多くの批判が寄せられていますが、これは誰もが自動運転を実践しているからではなく、誰もが自分は運転できると思っているからです。人間のドライバーのグループによって議論された無人技術に関する「コンセンサス」について考えてみると、そこには信頼できないものがたくさん含まれているでしょう。本当に国民の判断に従って開発していたら行き詰まってしまいます。

ロケットを運転できる人は、運転できる人に比べてはるかに少ないのです。したがって、ロケット製造の分野は比較的幸運であり、素人の合意が専門家の技術的な道を導くという悲劇はあまりありませんでした。この考えに基づくと、LLM フィールドは、この種の「ルート ノイズ」の影響を最も受けやすい領域です。

この種のルートノイズは、自動運転実践者に多大な影響を与え、さらには害を及ぼすこともあります。プレッシャーに耐え、雑音に抵抗して長期目標を貫くべきなのか、それとも投資家が言いたがるような言葉を最初に言って資金を調達し、短期目標を達成するために生き延びるべきなのか。実際、ほとんどの人は後者を選択します。

毎日 100 点を獲得して優等生になるか、一生に一度の機会を利用して革命的なビジョンに影響を与えるかです。不確実性が高く、業界のコンセンサスも少ないため、私は低い確率で奇跡を起こしたいと考えています。もちろん、チーム全員がユニークなスキルを持っており、一丸となってこの奇跡を達成できると信じています。

投資家が好むものに投資し、コンセンサスのある見解について毎日議論している人は、起業のプロセスを楽しんでいるだけです。しかし、私はビジネスを始めるプロセスを楽しんでいません。最終的な結果だけを見ています。結局のところ、この大義が無事に完了するという希望の光であり、この究極のビジョンが私にとって魅力的です。物事を成し遂げるためには、科学とビジネスの避けられない法則を尊重する必要があり、多くの場合、世間の認識に反することによってもたらされる大きな圧力に耐え、真実を守る必要さえあります。

Jiazi Guangnian: 何かが一般の認識と異なる場合、それはあなたにとって魅力を増しますか?

Hou Xiaodi: 主流とは違います。それはまだ始まりにすぎません。次に重要な作業は、事実に基づいた真実探求のプロセスです。この「差別化された認知」が最終的に論理的であるならば、それは大きな価値と可能性を秘めていると言えるでしょう。しかし、異なる認識を発見したからといって、新たなチャンスがあるわけではありません。もちろん興奮するでしょう。典型的な例は、米国で自動運転トラックを製造している企業はすべてSaaS、つまりSoftware as a Service(サービスとしてのソフトウェア)モデルであることです。もちろん、医薬品を変更せずにHardware as a Service(サービスとしてのハードウェア)としてパッケージ化することもできます。本質的には半製品を販売していることになります。私たち Bot.Auto は、Transportation as a Service を運営する唯一の会社であり、輸送サービスを販売しています。

Jiazi Guangnian: サービスとしての交通をどのように定義しますか?

Hou Xiaodi: 商品があれば、私が輸送します。お客様は、商品が無人運転か有人運転かを知る必要はありません。とにかく、輸送能力が十分であり、運賃も手頃です。自動運転ソフトウェアを販売している企業もあるが、問題は米国で自動運転ソフトウェアを購入できる顧客が 20 社しかないことだ。

Jiazi Guangnian: Transportation as a Service という概念の下で、あなたの革命的なビジョンは何ですか?

Hou Xiaodi: 自動運転の 1 キロメートルあたりの運用コストを人間のコストよりも低くしましょう。

Jiazi Guangnian: それはいつ実現できますか?

侯暁迪:2026年前半です。まだあと2年は頑張れます。

Jiazi Guangnian: この時点は業界のコンセンサスですか?

Hou Xiaodi: もちろん、それはコンセンサスではありません。他の人はそれを信じていませんし、同僚には時点を示す能力がありません。たとえば、Waabi(2021年に設立された自動運転会社)が語った話では、シミュレーションは世界最高であり、すべてが現実世界と同じであり、シミュレーションで解決できない問題はないということです。しかし、私はこの話を信じません。シミュレーション問題の最後の 1% が最も難しいからです。この点における絶対主義は経済効率とは相いれない。

もちろん、これは私の技術的な判断と派生したパスの判断にすぎません。公平を期すために、誰もが自分の信念を持って生きており、起業のプロセスは自分の信念を実現することです。

Jiazi Guangnian: 多くの人が自分は運転できると思っているので、自動運転を指差しているとおっしゃいましたが、これは大学入学試験の後、数学の問題について議論する代わりに、誰もがエッセイの問題を指差すのと似ていますか?

Hou Xiaodi: そうです。ほとんどの人は、L2/L4 現象の類似点は理解できますが、L2/L4 間のシステム アーキテクチャと設計のギャップには気づきません。飛行機とロケットが空を飛んでいるのは、飛行機の飛行速度がますます速くなり、2日でロケットに取って代わられることは素人でも簡単にわかります。しかし、物理学を勉強したことがある方なら、飛行機は大気圏外に飛び出すことはできませんが、ロケットは大気圏外に飛び出すことができることをご存知でしょう。部外者は過度に楽観的な外挿に依存しますが、真の内部者は物理学の本質に立ち返ります。

Jiazi Guangnian: 国内キャロット ランは最近非常に人気があり、技術面でも社会面でも多くの批判を受けています。それがどのように実行されているかに注意を払ったことはありますか?

Hou Xiaodi: まず最初に、これが良いことであることを確認しなければなりませんが、Baidu を称賛したいと思います。初期のプロモーターが注目を浴びると、世間からの大きな誤解に直面することになる。このプロセスについて一般の人々を教育することは、業界全体にとって有益です。

しかし、社会レベルでの議論は非常に退屈で、非常に無秩序で、非常に非効率的であると言わざるを得ません。アラン・ケイ (2003 年チューリング賞受賞者) は、人々は常に短期的なテクノロジーの短期的な進歩を過大評価するが、テクノロジーの長期的な影響を過小評価する、と述べました。 400台の自動運転車の導入はタクシー運転手にどれだけの影響を与えるでしょうか?今日の 400 台の車両の発売は良い影響を与えていますが、明日 40,000 台の車両が発売されるのではないかと心配している人がいるとしたら、それは全くの根拠がありません。現時点では、これをこれほど大規模に推進できる人は誰もいません。これはまさに、無人運転が解決すべき技術的な製品化の問題です。

明日には自動運転が可能になると考えることは、短期的な進歩を過大評価していることの表れです。同時に、一般の人々は長期的な影響を過小評価する傾向があります。たとえば、私たちの税金構造や旅行習慣は将来的に変化するのでしょうか。都市計画はどう変わったのでしょうか?より多くの郊外地域が住みやすくなり、人々は通勤しながら働くことができるようになるかもしれません。それが実際に考慮すべき長期的な影響です。

Jiazi Guangnian: 先ほどもおっしゃいましたが、私たちは SF の世界にあるものは何でも想像します。しかし、100年前の小説には書かれていなかったことが、今の携帯電話でできることはたくさんあり、確かに私たちのライフスタイルに大きな変化をもたらしています。

Hou Xiaodi: 技術発明は人間社会の複雑なネットワークにおける単一点のブレークスルーであり、単一点のブレークスルーは、関連する多数の複雑な変化を引き起こす可能性があります。人間の想像力には限界があるため、関連する多くの要素について明確に考えることが不可能になる可能性があるため、SF 小説が十分に具体的でないことを批判することはできません。これらのつながりは非常に複雑であり、新しいテクノロジーによって社会の形態がどのようになるかを予測するのは難しいことは認めざるを得ませんが、新しいテクノロジーが登場したときに、考え方が極端になって失業問題を提起すべきではありません。外。社会的な個人として、新しいテクノロジーがあるかどうかに関係なく、失業のリスクが存在する可能性があります。社会全体として、新しいテクノロジーはより広範な社会変化をもたらします。この変化には、新しい産業の台頭、古い産業の衰退、雇用の移動などが含まれており、決して単純で粗雑な失業問題ではありません。


エンドツーエンド、ルールベースおよび原則ベース

Jiazi Guangnian: 現在自動運転業界で推進されているエンドツーエンドのソリューションをどのように理解していますか?

Hou Xiaodi: 業界を知らない人が無差別に多くのことを言っており、概念が混乱しています。君がガンズ・アンド・ローゼズに、僕はヘヴィメタルのファンで、君が一番のお気に入りだと言っているようなものだ。ガンズ・アンド・ローゼズはヘヴィメタルではなくハードロックなので、心配しているはずです。 AC/DCもハードロックだし、ジューダス・プリースト、ブラック・サバス、メタリカもヘヴィメタルだ。

人々はいつも私に、あなたはエンドツーエンドですか?と尋ねます。学術的な厳密性を維持するために、私たちは単にエンドツーエンドではありません。しかし、彼が実際に聞きたいのは、より高度なテクノロジーを採用しているか、ということです。現状では、「エンドツーエンド」は学術的な概念ではなく、感情の伝達手段です。知識のない人は、機械学習の分野における未完の夢や未完の仕事を、「エンドツーエンド」という特定の技術概念に簡単に固定してしまう可能性があります。

Jiazi Guangnian: つまり、エンドツーエンドの概念が「カササギの巣を占領」し、人々はエンドツーエンドを高い精度で同一視するようになる、ということですね。

Hou Xiaodi: エンドツーエンドの利点は、ニューラル ネットワークの一部をモジュールとして考えることができ、モジュール間の通信と接続の帯域幅が非常に高いことです。 2 番目の利点は、モジュールのトレーニング中にエラーの伝播が達成され、たとえば、動作計画のトレーニングが知覚に直接影響を与える可能性があることです。しかし、目的と手段は同じではありません。 「エンドツーエンド」という特定のテクノロジーにこだわる必要はありません。他の多くのテクノロジーにもそのような特徴があります。

そして私は「コネクショニズムがすべてを解決する」という考えを批判しなければなりません。すべてのエンドツーエンドはニューラル ネットワークでなければならないという誤解が常にあります。ニューラル ネットワークではないものを追加すると、これは非常に不快です。人工知能の 3 つの主要な学派、つまりコネクショナリズム、行動主義、シンボリズムにはそれぞれ独自の強みがあります。1 つの教義ですべての問題を解決できるわけではありません。

この意味で、私は最近この問題を非常にうまく解決した AlphaGeometry などの DeepMind のスタイルがとても気に入っています。 AlphaGo から AlphaGeometry まで、DeepMind は常に包括的でした。あらゆるジャンルの人工知能の最高のものを引き出します。教義上の論争には関与せず、最終的に問題を解決するシステムに取り組む。

(注: Google の DeepMind は、2024 年の国際数学オリンピックで銀メダリストのレベルに到達するために、AlphaProof と AlphaGeometry2 という 2 つのシステムを使用しました)

Jiazi Guangnian: エンドツーエンドの説明可能性の欠如が大きな障害となっていますか?

ホウ・シャオディ:はい!さらにとんでもないことは、説明可能性の欠如を、恥じることなく誇りに思うような方法でパッケージ化する人がいることであり、私はさらに反対です。マスク氏は毎日、私たちはもうコードを書かないと簡単に言います。しかし、彼の言葉は広告でありマーケティングです。エンジニアリングの実践は、彼の言ったことよりもはるかに複雑です。トレーニングプロセス中の非収束によって引き起こされたたった 1 つの NaN (Not a Number) で、何人のエンジニアが殺されたでしょうか?

エンドツーエンドネットワークの実際のトレーニングは、自動化された工場の開発モデルではなく、この段階ではまだ形而上学に満ちた「ワークショップスタイル」の開発モデルであり、「マスター」による手動の磨きが必要です。どの詳細を改善する必要があるかがわかったら、まずネットワークの他の無関係な部分をフリーズし、次に中華料理人の炒め物のように「適切な」量のトレーニング データを準備し、トレーニング、テスト、反復を続ける必要があります。

私が聞いた最も極端な議論は、自動運転の走行距離は克服できるというものですが、これは数千万キロメートルと大量のコンピューティング能力が必要な例外的なケースです。これは、自分自身のファンタジーの世界に住んでいる場合の典型的な現象です。そもそも、話を聞く責任のある人(投資家)がそれほど強い主観的な態度を持っている場合、もし方法があるなら、良い方法があり、その下には悪い方法があるに違いありませんが、その場合はどうすればよいかを考えてください。ストーリーを伝える責任のある人(起業家)は、次のことに集中できます。 「データ駆動型」と「エンドツーエンド」のアプローチにより、私たちはとんでもないビジョンを捏造してきました。この二つがお互いを補い合い、泡が生まれるのです。

Jiazi Guangnian: 業界の多くの自動車会社が、自社のエンドツーエンド ソリューションが間もなく市場に投入されると言っています。

Hou Xiaodi: マスク氏は、短期的には改ざんできない一連の言葉について話しています。なぜエンドツーエンドの Robotaxi がまだできないのかは尋ねないでください。心配しないでください。私たちは次のバージョンをトレーニングしているだけです。十分なコンピューティング能力またはデータがありません。私はかつて、ロバの前にニンジンをぶら下げた写真をWeChatモーメントに投稿しました。これはロボタクシーとテスラの株主の様子です。


画像出典:X

さらに、マスク氏は成功者であり、マスク氏を信じること、そしてマスク氏に従うことは、現在のベンチャーキャピタル界においても政治的に正しいことである。一方、この反証不可能な単語は使いやすく、あらゆる年齢層に適しています。二流および三流の技術チームは、技術的なギャップをデータとコンピューティング能力のギャップとして完全に説明できます。データが十分ではなく、計算能力も十分でない場合は、送金を求められます。これは完全な閉ループです。

Jiazi Guangnian: 彼らの学校以外に、あなたはまだ伝統的な規則に基づいた学校があると思いますか?

Hou Xiaodi: ルールベース自体は不明確な概念です。ルールベースが何であるかについては、人々は非常に主観的です。そのため悪用されやすく、最終的には客観的な論理を探求するための「道具」ではなく、主観的な感情を表現するための「武器」になってしまいます。私の元同僚でありツーソン大学の元主任科学者であるワン・ナイヤン氏のブログでは、ルールベースではなく原則ベースについて言及していましたが、私もそれに同意します。

あたかもすべてのルールベースのメソッドが何万もの if else で構成されているかのように、誰もがルールベースのメソッドを非難してきました。しかし、議論しなければならないのであれば、ニューラル ネットワーク自体は実際には巨大なルールベースのシステムです。線形演算子と非線形演算子を含むネットワークの内部を開きます。各非線形演算子は if else の特定の実装であり、ニューラル ネットワークは数十億の if else で構成される巨大なルールベースのシステムです。

業界の誰かがプログラミング言語で数万の if else を作成する場合、それは純粋に、そのエンジニアリングの実装レベルが低すぎるためであり、ルールベースのシステムではいかなる状況下でも数万の if else が存在することを許可すべきではありません。これが結論です。最後の 2 番目の行は、たとえば、車両が二重の黄色の線を越えることができる場合、1 つ、2 つ、または 3 つの条件を明示する必要があるということです。これを私の場合はルールベースと呼んでいます。私が L4 自動運転のチームを率いている限り、私たちのシステムにはルールベース、つまり原則ベースが含まれていなければなりません。私は、完全に原則に基づいていない L4 システムを道路に導入することを許可しません。これが安全性の最低ラインです。

私たちのシステムの基礎となるのは基礎モデルです。しかし、それに基づいて、解釈可能性の設計と実装が強調されます。社内ではこのフレームワークを Foundation to all (F2A) と呼んでいます。 ‍

Jiazi Guangnian: あなたは完全な説明可能性を追求してきました。

Hou Xiaodi: L4 は解釈可能でなければならず、不明確なデータのブラック ボックスだけに依存することはできません。

ここには、要件、設計手法、エンジニアリング実装の 3 つの要素があります。解釈可能性は原則ベースであろうと学習ベースであろうと要件であり、設計手法であり、if-else の記述はエンジニアリング実装です。需要は客観的に存在します。方法に限界があるからといって、その需要を否定しないでください。だからこそ私は、L4 は解釈可能でなければならないと言ったのです。

さまざまなデザイン手法の間には、おそらくあなたの中に私がいて、私の中にあなたがいるでしょう。その価値は、議論することではなく、主な矛盾を強調することにあります。議論するのであれば、すべてのニューラル ネットワークはルールベースのシステムです。結局のところ、エンジニアリングの実装における品質のギャップは、人間と犬の間のギャップよりも大きいのです。不適切なエンジニアリング実装を使用して、設計手法の方向性を導く役割を無効にすることはできません。


トラックとロボットの共通点

Jiazi Guangnian: トラックと乗用車の技術的課題の違いは何ですか?自動運転トラックの進歩が乗用車に比べて遅いと感じるのはなぜでしょうか?

Hou Xiaodi: トラックは実用化に近づいています。これが、私がツーソンを去った後も無人トラックの研究を続ける理由です。トラックは、主にVCのせいで、人型ロボットなど、日常的に接触するものに投資することを好むため、自動車ほど注目されていません。しかし、トラックの交通ルールは自動車の交通ルールよりもはるかに明確であり、正しく定義できます。どのような状況で私がすべきか あなたがどのような行動をするかが私にとって最も重要です。

Jiazi Guangnian: 余談から始めましょう。最も商業的な可能性があるロボットは何だと思いますか?

Hou Xiaodi: 現在の人型ロボットの研究は次のようなものです。テクノロジーは進歩しているので、労働力が不足しているのでこの分野に目を向けるべきです。現時点では、誰もが一般的に同意できるコンパニオンロボットはまだ遠いです。現在のロボットの応用市場は工場です。多くの実践者は私と同じように考えています。ロボットの初期の応用シナリオには、なぜ脚が必要なのでしょうか。しかし、脚は確かに、一般の人々に SF と無限の連想を抱かせる人気のコミュニケーション ポイントです。

Jiazi Guangnian: つまり、VC は自動車などの to-C 製品や、トラックなどのクールな製品の見た目が十分ではないと考えています。しかし、あなたにアプローチする投資家は、トラックに少しでも興味を持っています。彼らはどのような人々であり、どのような特徴があるのでしょうか?

Hou Xiaodi: トラックに注目する投資家はより現実的です。現在でも自動運転車に人々は注目しており、ここ数年では自動車よりもトラックに注目する人の方が多くなりました。焦点が絞られた今、トラックの自動運転事業に本腰を入れることができる投資家は、それが利益を生むかどうかに焦点を当てている。これは非常に単純な計算です。テクノロジーの進歩により、これらはすべて非常に単純な計算になります。

Jiazi Guangnian: 車を見ることだけが好きだった VC が今ではロボットに注目していると言えますか?

侯暁迪:最近では、無人トラックはある程度ロボットとみなせると考えられています。ロボットは必ずしも脚や腕を持たずに工場内を走行することもできますし、吊り下げて公道を走行することもできます。ロボットの評価基準の一部を自動運転に置くと、自動運転トラックはその基準を満たすことができ、自動運転会社はロボット会社に比べて非常に安価です。

Jiazi Guangnian: 現在のコストのうち、比較的高いものはどれですか?

Hou Xiaodi: Android スマートフォンの例を挙げましょう。私自身も長年 Android ユーザーです。初期の Android ユーザーは、「充電していない場合は点滅している」という自己破壊的な方法を使用していました。しかし、携帯電話システムが成熟するにつれて、充電や点滅などのメンテナンスイベントの頻度はますます低くなり、L4自動運転でもそのようなプロセスが発生することになります。

私たちの主なタスクは、日々のメンテナンスをより安価に、より短時間で、より自動化することです。 Bot.Auto は世界をリードするテクノロジーを持っていますが、テクノロジー企業として宣伝するのではなく、世界最先端のテクノロジーを使用して業務を遂行します。私たちは高尚なアルゴリズム科学者のグループではありません。私たちは貨物物流業界の現実的な実践者にすぎません。テクノロジーによって生み出される価値は、テクノロジー自体の美しさではなく、業務に反映される必要があります。

Jiazi Guangnian: 具体的には、どうすればメンテナンスが容易になるでしょうか?

Hou Xiaodi: たとえば、カメラが汚れているかどうかを検出できますか?カメラはいつ掃除しますか?誰がそれを拭きますか?どうやって拭くのですか?拭いてからきれいになるまでどれくらいかかりますか?おそらくこのような質問は他にも何千件もあるでしょう。過去の経験に基づいて、ドライバーの介入なしで新しい自動化技術を使用してこれを再度実行することを検討したいと考えています。

この業界は基本的に 2 種類の問題に直面しています。1 番目の問題は、安全冗長システムをどのように構築するかです。これがゲームの前半です。当時、ツーソンはそれを行った最初で唯一の世界でした。数日前、(アメリカの自動運転トラック会社)コディアックは砂漠でドライバーアウトテストを完了したが、一般道路ではなく非常に低速であり、他の車両との相互作用はあまりなかったことが主な売りだった。ポイントはハードウェアの冗長性でした。私も賞賛すべきだと思います。しかしツーソンは、一般道路での完全無人大型トラックのテストを完了した世界で唯一の車両だ。


画像出典: TuSimple

前半が完了すると、非常にパフォーマンスの高いシステムが完成しますが、非常に高価になります。下期は高価なシステムを安くすることを検討する必要があると考えています。

Jiazi Guangnian: 他の自動運転トラックの動向に注目しますか?

Hou Xiaodi: 業界のトレンドについては少し知っていますが、競争の観点からは注意を払っていません。今は競争する時期ではありません。業界には 3 つのステージがあります。つまり、登山、ランニング、ボクシングです。私たちはすべて最初のステージにいます。企業が自動運転車の運用コストを人間のドライバーと同等にすることで、第 1 段階は終了します。第 2 フェーズは、自動運転によってもたらされる追加生産能力が現在のトラック運転手不足を超えた時点で終了します。第 3 段階では直接競争が行われます。

たとえば、地球上に誰も登ったことのない雪山があります。私は世界で初めてその頂上に登りたいと思っています。いいえ、運動をして地形を調査し、準備が整ったら登りたいと思っています。これは、他の人もこの雪山に挑戦したいと思っていることを私が知っているかどうかとは関係ありません。


ほとんどの人は真の信者を募集したいと考えています

Jiazi Guangnian: Bot.Auto には現在何名いますか?

侯暁迪:40人以上です。

Jiazi Guangnian: あなたは以前、自動運転会社はモデルレベルの会社と同様、それほど労働集約的なものではないと感じているとおっしゃいました。

Hou Xiaodi: 過去数年間、エコシステムには何もなかったため、確かに多くの人が必要でした。しかし今ではそれは野蛮ではなくなり、私たちが必要とする「車輪」のほとんどが普及しました。コンピューティングユニットやセンサーなどの成熟度は、例年よりもはるかに高まっています。大規模なモデルの並列トレーニングに利用できるオープンソース プラットフォームは無数にあり、クラウド上にはさまざまなコンピューティング リソースも十分に提供されているため、組織構造を再考する必要があります。

5年前、私はMidjourneyのような会社、つまり10人で何百万ものユーザーがいる製品を作ることができる会社は不可能だと思っていましたが、今ではそのような会社はますます増え、製品のコア。

Jiazi Guangnian: そうすれば、コンピューターのホストを購入するのと同じくらい簡単になります。この状況で最も採用したいのは誰ですか?

侯暁迪: 私が一番望んでいるのは、真の信者を集めることです。

Jiazi Guangnian: 真の信者をどのように定義しますか?

侯暁迪氏: テクノロジーは非常に重要ですが、オリンピックの優勝と準優勝争いは通常、テクノロジーによって決まるわけではありません。起業家精神は短距離走ではなく長距離走です。自動運転企業の多くは慢性疾患ではなく、急性疾患で死亡しています。会社を安定して長く存続させなければなりません。エンジニアにとって、特定のエンジニアリング問題を 1 週間で解決するか、1 週間半で解決するかは、もはやそれほど重要ではありません。

第二に、資本が非常に潤沢なときは、私は自由な精神を持ち、個人主義によって思いがけないほど突き動かされるようになります。Google がいつも Gmail は 20% のシステムによって育てられたと言っているのと同じです。 Google はかつて、各エンジニアは労働時間の 20% を自由に費やすことができると述べました)。

しかし現在、資本調達コストは非常に高く、連邦準備制度は金利を引き下げず、資金調達は非常に困難です。私たちは企業レベルで、ボトムアップからトップダウンへ、個々の知的才能の瞬間から組織化された企業戦略への変革が必要です。この場合、個人に与えられる自由と時間はますます少なくなり、実は資源の不足と関係しています。

Jiazi Guangnian: これは自動運転業界にのみ当てはまるのでしょうか、それともこの傾向は技術分野全体に当てはまるのでしょうか?

Hou Xiaodi: それはテクノロジー業界全体だと思います。私が知っている他の会社では、従業員に自分の意見を表明する余地をあまり与えていません。正直に言うと、Google が 20% 制度を誇示したのが、どれだけ宣伝目的だったのかも検討する必要があります。

Jiazi Guangnian: しかし、今人気のあるモデル会社やスターチームは、多くても十数人で、チームリーダーは1人か2人の天才で、次のような非常に良い製品を作っています。ソラとピカ。

Hou Xiaodi: 実際、ほとんどの企業のほとんどの人が行ったことは、特に純粋なソフトウェアのレベルでは、理論を 1 つまたは 2 つ超えたものです。それらはすべてラマのモデルの貝殻であるという人もいますが、私はそのような極端な発言には同意しませんが、この場合、個人の能力の閃光が地球を揺るがす変化をもたらしたわけではありません。

Jiazi Guangnian: つまり、採用した人材が、会社が提示したアイデアを上から下まで実行できることを期待しているのですね。

Hou Xiaodi: 5 年前は、優秀な従業員に対応するためにいくつかの特別プロジェクトを立ち上げていましたが、今はそうではありません。私たちの中心的な価値は、運用コストを削減できるかどうかです。素晴らしい論文を発表しているとは言えませんが、基礎研究の仕事がしたいので、自由な雰囲気が必要です。おそらく、過去であれば企業も学術機関と同じ自由な立場を持っていたでしょうが、近年はそうではありません。

Jiazi Guangnian: これでは、候補者はあなたが権威主義的すぎると考えるでしょう。

侯暁迪: 研究の自由を望むなら、学会を選ぶこともできます。あるいは資本力があり、すでに独占状態にある大企業を探すべきだろう。私たちの小さな会社は、たとえ資金を調達したばかりであっても、破産の危機に瀕しているという精神を持たなければなりません。このような精神では、実際にオープンに活動する自由はありません。研究。

さらに、「トップダウン」のコーポレート・ガバナンスの考え方についてもお話ししたいと思います。これはテクノロジーとは関係なく、中小企業として専門家をどう活用するかということです。

弁護士を例に挙げてみましょう。弁護士は、企業法務弁護士と訴訟弁護士の 2 つのカテゴリーに分けられます。企業法務担当者からは、「これはコンプライアンスに違反しているからリスクがある」と言われることがありますが、これらの提案をトップダウンの企業戦略に組み入れずにすべて受け入れてしまうと、最終的にできることはほとんどなくなります。 . 訴訟弁護士は毎日訴訟を起こして血を舐めるような生活をしているので、できないことは教えてくれませんが、やればリスクはありますが、やらないほうがリスクは大きいです。 , だから、まだやる必要があります。優れた訴訟弁護士は、リスクを警告するのではなく、トップダウンの全体的な戦略を直接教えてくれます。

自分自身のトップダウンの戦略的バックボーンを持たずに、「プロがプロの仕事をする」ということに依存しすぎると、すぐに功を求めず過を求めない状態に陥ってしまいます。しかし、スタートアップは常に流れに逆らって泳ぐものであり、そのような状態に陥ることは非常に危険であり、死に至る可能性もあります。中小企業の存続の本質は、会社全体の方向性において奇跡を起こせるかどうかにある。

Jiazi Guangnian: 初期のツーソンの CTO から CEO になり、現在は Bot.Auto を立ち上げていますが、最も困難な移行は何ですか?

侯暁迪氏: これからは、財務、法務、資金調達、広報などの研究を強化する必要があります。以前はプロの人がプロのことをやれば十分だと思っていましたが、今は各レベルをまとめる核となる戦略を立てる必要があると考えています。さまざまな奏者がさまざまな楽器を演奏するように、最終的には全員が指揮者が担当する主旋律に戻ります。会社は、会社のビジョンと使命を深く理解し、すべての関係者が同じ方向に進むことができるようなリーダーを必要としています。これが CEO に必要な変化です。

今では自分で詳細を把握することは少なくなりました。アルゴリズムの問​​題が 1 か月後まで解決できない場合、私はテーブルをたたいて自ら戦いに行くかもしれませんが、今ではこのようなことは二度と起こりません。あなたがそれを終わらせられないなら、私は自分ではやりません。しかし、私は全体的な方向性についてもっと時間を費やし、原則と戦略について全員と同期していきます。

Jiazi Guangnian: ビジネスを始めた時から現在に至るまで、あなたが長年信じてきた目標や原則に他に変化はありましたか?

Hou Xiaodi: 変わらないところから始めましょう。自動運転が必要な理由は3つあると先ほど言いました。第一に、私の仕事は意味があり、生産性を向上させることができ、やりがいのあるものである必要があります。第二に、それはテクノロジー主導であり、テクノロジーが価値創造をもたらすものでなければなりません。第三に、ビジネス モデルはシンプルでなければならず、自分自身にノーとさえ言えません。 . 明確なビジネスモデル。この3点は今Bot.Autoをやるまで変わりません。

変わったのは、以前は技術的な立場に自分を置きすぎていたことです。熟練しているということは、自分の欠点をすべてカバーする美しさと同じことです。でも今は、自分自身が六角戦士となって会社をあらゆる面から守りたいと思っています。急性疾患による死亡を避けるためには、あらゆる面で慎重に検討する必要があります。同時に、会社は一方向に進み、従業員を団結させるための戦略を立てる必要があります。

これまでの経験では、ほとんどの場合 CTO の役割を担っていました。私は会社が間違った方向に進んでいると感じ、CEOに就任しましたが、以前の「万里の30年」の問題を回復するのが難しいことに気づきました。今回は最初からCEOの職務を十分に遂行できるため、会社が常に最初から正しい戦略的軌道に乗っていることを確認する必要があります。

※この記事の取材にもAさんにご協力いただきました


メディア協力連絡先WeChat ID |ciweimeijiejun

私たちとコミュニケーションを取りたい場合は、バックグラウンドで「グループに参加」と返信すると、コミュニティに参加できます。