berita

Dialog antara Lang Xianpeng dan Jia Peng, seorang yang kurang berprestasi, mengapa dia menyerahkan makalahnya lebih awal?

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Mengemudi dengan cerdas, balapan mahal dimulai. Menentukan peringkat dan menentukan masa depan.

Teks丨Cheng Manqi Dou Yajuan
Editor 丨 Song Wei

Gu Junli, yang pernah bekerja untuk Tesla dan Xpeng, mengatakan bahwa kemajuan penelitian dan pengembangan yang didorong oleh kecerdasan Tiongkok setidaknya 1,5-2 tahun di belakang Tesla. Lang Xianpeng, wakil presiden Lideal Zhijia, percaya bahwa kesenjangannya tidak terlalu besar, dan Lideal tertinggal paling lama setengah tahun dalam hal pengalaman produk.

Ideal menekankan bahwa keunggulannya dalam berkendara cerdas adalah ia memiliki lebih banyak mobil dan lebih banyak data.

Perang harga masih berkecamuk, dan kekuatan otomotif baru Tiongkok secara kolektif telah memasuki medan perang baru - mengemudi cerdas, yang penuh dengan perbedaan, perselisihan, dan kejar-kejaran satu sama lain.

Tidak semua perusahaan mobil mampu membeli tiket ini. Investasi penelitian dan pengembangan dalam mengemudi cerdas dimulai dengan RMB 3 miliar dan terus meningkat dari tahun ke tahun. Idealnya, menyewa kartu sekarang berharga 1 miliar yuan per tahun dan akan menelan biaya 1 miliar dolar AS di masa depan.

Alasan mengapa kekuatan baru begitu gila dan tidak mau ketinggalan adalah karena mereka telah melihat kemajuan besar dari Tesla FSD V12 (versi baru dari penggerak otonom penuh yang akan mulai didorong oleh Tesla dalam skala besar pada Januari 2024), dan mereka juga telah melihat dampak dari kemampuan mengemudi yang cerdas terhadap keputusan konsumen. Pada bulan September tahun lalu, Huawei mengumumkan bahwa mereka akan meluncurkan solusi tanpa gambar yang dapat digunakan secara nasional pada akhir tahun. Pada saat yang sama, industri ini sedang gencar mempromosikan mengemudi cerdas. Hanya dalam satu bulan, volume penjualan bulanan, yang mencapai ribuan, melebihi 10.000, dan pada akhir tahun mencapai angka 30.000.

Tidak lama setelah Huawei mengumumkan rencana mengemudi cerdas yang radikal, Ideal mengadakan pertemuan strategi musim gugur tahun 2023 dan memperjelas bahwa mengemudi cerdas adalah strategi inti dan tidak boleh hilang. CEO Li ingin mengatakan, “Kami akan menjadi pemimpin mutlak dalam mengemudi cerdas pada tahun 2024.”

Sejak itu, Ideal telah mempercepat iterasi dan bergerak maju dalam dua bidang: saat menggunakan NPN (Neural Prior Net, algoritma saraf apriori, yang menggunakan informasi apriori dari beberapa jalan dan peta untuk membantu mengidentifikasi fitur jalan dan mengurangi ketergantungan pada peta presisi tinggi ), kami akhirnya mengejar ketertinggalan. NOA Seratus Kota diluncurkan pada akhir tahun lalu pada periode yang sama, NOA tanpa gambar telah dikembangkan sebelumnya pada bulan Oktober tahun lalu, dan pengujian internal dengan ribuan orang dimulai pada empat tahun yang lalu. beberapa bulan kemudian, dan diluncurkan sepenuhnya pada bulan Juli tahun ini.

Pada musim panas ini, tidak ada waktu untuk bernapas. Kekuatan baru sedang memasuki pertempuran berikutnya: end-to-end. Sebuah istilah teknis yang tidak dipahami sebagian besar konsumen telah menjadi medan pertempuran bagi para ahli strategi militer.

Pentingnya end-to-end adalah membawa penelitian dan pengembangan penggerak cerdas ke era AI - tidak lagi bergantung pada banyak pemrograman manual selama lebih banyak data digunakan untuk melatih model, sistem akan terus berlanjut menjadi lebih kuat dan mungkin berkinerja lebih baik daripada pengemudi manusia. Musk percaya bahwa hal ini membawa manusia lebih dekat ke arah mengemudi yang sepenuhnya otonom.

Ideal minggu ini meluncurkan pengujian internal yang melibatkan seribu orang terhadap arsitektur baru "end-to-end + VLM (Visual Language Large Model)", menyebutnya sebagai model yang lebih canggih dan implementasi sistem ganda pertama di dunia. Satu model berarti modul persepsi dan pengambilan keputusan dalam mengemudi otonom semuanya diselesaikan oleh satu model. Inputnya berupa data sensor dan outputnya adalah lintasan berkendara.



Mengemudi otonom memiliki tiga modul: persepsi, perencanaan dan pengambilan keputusan, dan kontrol, yang mengandalkan persepsi untuk “melihat”, pengambilan keputusan untuk “berpikir” cara mengemudi, dan modul kontrol untuk menyelesaikan perilaku mengemudi. Teknologi end-to-end mulai dari persepsi hingga pengambilan keputusan, dan seluruh proses diimplementasikan menggunakan model besar.

Sekitar waktu ini, Weilai mengumumkan produksi massal AEB (fungsi pengereman darurat) end-to-end pada awal Juli; Xiaopeng menegaskan kembali minggu ini bahwa ini adalah satu-satunya perusahaan mobil di dunia yang mencapai produksi massal end-to-end dalam jumlah besar Model lainnya tentu saja adalah Tesla Pull. Jika Anda termasuk pemasoknya, Huawei dan Momenta telah menyelesaikan peluncuran end-to-end tahun ini.

Ideal baru akan mulai mengembangkan smart mengemudinya sendiri pada tahun 2021, dua tahun lebih lambat dari Weilai dan Xpeng. Kemajuan Ideal saat ini seperti orang yang kurang berprestasi yang tiba-tiba mengetahui jawabannya dan menyerahkan makalahnya terlebih dahulu.

Saat ini, kami berbicara dengan Lang Xianpeng, wakil presiden Ideal Intelligent Driving, dan Jia Peng, kepala Litbang Teknologi Ideal Intelligent Driving. Mereka menjelaskan bagaimana hal ini dicapai.

Lang Xianpeng adalah seorang pengemudi cerdas yang suka menamai proyek-proyek penting dengan nama mitologi Yunani. Kampanye yang dia selesaikan di Ideal termasuk "Acropolis", "Iliad" dan "Titan". Pada tahun 2018, Lang Xianpeng bergabung dengan Ideal dari Baidu sebagai direktur mengemudi otonom dan kemudian dipromosikan menjadi wakil presiden.

Jia Peng adalah kepala muda penelitian dan pengembangan teknologi. Dia adalah salah satu orang pertama yang melakukan berkendara cerdas di NVIDIA di Tiongkok. Ia melihat bahwa raksasa chip tersebut merupakan pihak pertama yang mengusulkan model penggerak otonom berskala besar dan menyeluruh, namun ia menemukan bahwa hanya perusahaan mobil yang benar-benar dapat menerapkannya.

Perusahaan yang berkomitmen penuh terhadap end-to-end memiliki peta jalan dan kemajuan yang berbeda, namun mereka memiliki satu ambisi dan satu arah teknis yang sama: untuk pada akhirnya mewujudkan pengemudian otonom L4.

Kami melihat kegemaran saat ini terhadap berkendara cerdas dan end-to-end, bukan hanya karena keyakinan teknis, namun juga karena persaingan, mentalitas pengguna, dan peringkat penjualan.

Ini balapan yang mahal. Biayanya bukan hanya biaya besar untuk merekrut orang, membeli GPU, dan model pelatihan. Sebelum L4 benar-benar terwujud, masih akan ada manusia yang duduk di kursi pengemudi. Keselamatan, keandalan, dan stabilitas menjadi standar pengujian pengguna untuk berkendara cerdas saat ini.

Mereka yang kurang berprestasi menyerahkan kertas

"Terlambat": Ideal hanya akan memulai mengemudi cerdas yang dikembangkan sendiri pada tahun 2021, lebih lambat dari Xpeng dan NIO, dan selalu berada dalam kondisi mengejar ketertinggalan. Hingga tahun ini, mereka beralih langsung dari NPN ke NOA tanpa gambar, dan kemudian memulai pengujian internal menyeluruh dengan ribuan orang pada minggu ini. Ada yang berkomentar, kenapa yang kurang berprestasi tiba-tiba menyerahkan makalahnya lebih awal?

Lang Xianpeng: Ini mungkin serangan balik diaosi.

Kami melakukan tiga generasi tahun lalu, dari grafik hingga NPN "informasi sebelumnya" hingga tanpa grafik. Pada bulan Juni tahun ini, arsitektur end-to-end telah diverifikasi, dan arsitektur sistem cepat dan lambat juga diusulkan. Sistem cepat bersifat end-to-end, yaitu kemampuan memproses informasi dengan cepat untuk berkendara sehari-hari; sistemnya adalah VLM (Visual Language Model), yang merupakan Kemampuan untuk menangani skenario yang kompleks.

Selain itu, end-to-end kami adalah satu model, masukannya adalah sensor, dan keluarannya adalah lintasan berkendara, semuanya diterapkan oleh satu model, tanpa ada aturan di tengahnya. Kecuali Tesla, produsen mobil lain hanya menerapkan end-to-end di link tertentu.

"Terlambat": Kemajuan penting pertama Anda - dari solusi NPN hingga tidak ada gambar, Anda mulai memverifikasinya pada bulan Oktober tahun lalu, diuji secara internal pada bulan Februari tahun ini, dan diluncurkan sepenuhnya pada bulan Juli. Hanya butuh waktu 4 bulan untuk menyelesaikan peralihan tersebut. Kedengarannya luar biasa.

Lang Xianpeng: Kami lebih efisien dan lebih cepat dibandingkan yang lain. Misalnya, menghemat banyak proses pengambilan keputusan. Dari memutuskan apa yang harus dilakukan, membuat rencana, hingga mengumpulkan tim, mungkin hanya memakan waktu seminggu. Jika itu adalah perusahaan mobil tradisional, mungkin diperlukan waktu 3 bulan untuk memulai proyeknya.

"Nanti": Apa yang Anda korbankan untuk ini?

Lang Xianpeng: Mungkin ini istirahat pribadi. Semua orang mengetahui tujuan perusahaan dan kami tidak boleh mundur.

Jia Peng: Aku juga sudah terbiasa. Saya mengundurkan diri dari NVIDIA dan bergabung dengan Ideal pada tahun 2020. Lingkungan yang selalu kami hadapi adalah kami kurang berprestasi dan setiap hari dimarahi oleh orang tua kami.

"Nanti": Apakah ini orang tua Li Xiang?

Jia Peng: Itu adalah pengguna.

"Nanti": Tampaknya arah jalur teknologi mengemudi cerdas Anda sangat jelas - yaitu belajar dari Tesla.

Lang Xianpeng: Semua orang akan mengira bahwa penelitian dan pengembangan teknologi membutuhkan waktu, namun seringkali yang dibutuhkan bukanlah waktu penelitian dan pengembangan, melainkan waktu trial and error. Tesla memang menjadi benchmark yang bagus. Jika gagal melalui trial and error, kami tidak akan pergi.

Evolusi dan iterasi Tesla FSD telah menunjukkan kepada kita bahwa kesuksesan dapat dicapai tanpa gambar. Pilih NPN atau tanpa gambar? Sekarang Tesla telah keluar, kami tidak memilih gambar apa pun, jadi kami beralih dalam beberapa bulan.

Namun inspirasi terbesar Tesla bagi kami adalah bagaimana beralih dari 0 ke 1, dan dari 1 ke 10 dalam penelitian dan pengembangan kendaraan otonom. Tesla pertama kali menggunakan solusi pemasok Mobileye untuk mengemudi cerdas, tetapi segera menemukan bahwa pemasok tersebut tidak dapat memenuhi persyaratannya, sehingga perusahaan tersebut memulai penelitian mandiri pada tahun 2016, mengalami periode kejutan, dan akhirnya mencapai hasil Mobileye. Pada tahun 2019, perusahaan ini mengembangkan chip FSD-nya sendiri dan memiliki perangkat keras untuk mendukung penelitian dan pengembangan AI. Sejak itu, perusahaan ini berkembang secara end-to-end.

"Nanti": Inti dari V12 adalah end-to-end. Faktanya, versi V11 yang diluncurkan oleh Tesla pada awal tahun 2023 tidak memiliki gambar.

Lang Xianpeng: Sepertinya semua orang menganggap matematika tingkat lanjut itu sangat penting, tetapi jika Anda tidak mengetahui empat operasi aritmatika, bagaimana Anda bisa mempelajari matematika tingkat lanjut dengan baik?

Saya juga berkomunikasi dengan Wu Xinzhou (mantan kepala mengemudi cerdas Xiaopeng) tentang hal ini. Kita semua sepakat bahwa seluruh proses dapat dipercepat, namun tidak boleh dilewati. Setiap orang melakukannya secara end-to-end, tetapi dari grafik, NPN, tanpa grafik hingga end-to-end, setiap langkah tidak dapat dihilangkan. Dengan melewatkan langkah-langkah ini, Anda sebenarnya melewatkan banyak pemahaman teknis.

Jika kita tidak mencoba membangun NOA di seratus kota pada paruh kedua tahun lalu, kita tidak akan memiliki pemahaman yang jelas tentang kegagalan NPN. Dari segi skala saja, hanya ada 30.000 hingga 400.000 kilometer jalan raya di negara ini, namun ada jutaan kilometer di kota-kota. Jika kita ingin memperluasnya ke seluruh negeri, peta ini tidak akan selesai sama sekali.

"Nanti": Tapi Anda mengatakan sebelumnya bahwa keputusan besar bukanlah pertanyaan apakah Anda bisa melakukannya, tapi pertanyaan apakah Anda berani melakukannya.

Lang Xianpeng: Bukannya tidak bisa dilakukan. Jika benar-benar dilakukan, ini akan menjadi perang sumber daya. Pokoknya kalau mau dilakukan, ribuan orang akan menyebarkannya.

Jia Peng: Kami bercanda di antara kami sendiri bahwa jalan ini pada akhirnya akan berubah menjadi perusahaan peta.

"Nanti": Apa yang Anda andalkan untuk mempercepat nanti?

Lang Xianpeng: Efisiensi organisasi selalu menjadi keuntungan ideal. Dari NPN ke tanpa grafik, dan kemudian ke end-to-end, ini adalah peralihan besar, tetapi kami melakukannya segera setelah kami memintanya.

Efisiensi kerjasama antara R&D dan pengiriman sangat penting. Teknologi harus menembus batas atas. Yang sulit adalah menentukan pilihan, tetapi setelah menentukan pilihan, pengiriman harus bertanggung jawab untuk menaikkan batas bawah. Pada rapat strategi perusahaan paruh kedua tahun lalu, Li Xiang menegaskan bahwa RD (penelitian dan pengembangan) dan PD (produksi massal dan pengiriman) harus dilakukan bersama-sama menjadi dua lini PD dan RD dalam tim kami. Kami melakukannya tanpa gambar pada bulan November dan Desember tahun lalu. Pada bulan Januari tahun ini, RD segera ditransfer ke PD. Pada bulan Februari, versi 5.1 pertama kali diberikan dan terus dikirimkan. lalu Beta 1, Beta 2, dan Beta 3. Sudah dipoles dengan baik.

Jia Peng: Menurut saya, ini adalah proses trial and error yang cepat. Proses kami adalah: menemukan area yang tertutup, memverifikasi paradigma dalam waktu singkat, pertama-tama mencapai batas atas dari apa yang dapat dicapai oleh paradigma ini, dan segera memperluas ke luar setelah area tersebut dibersihkan, secara bersamaan menambahkan kebijakan keselamatan, dan kemudian perlahan-lahan luncurkan. Mari kita uji paradigma ini di seluruh negeri untuk melihat apakah ini berhasil. Jika tidak, kita akan segera menambahkan data dan mengubah strategi. Dalam proses penerimaan produk, mulai dari tahap awal hingga tahap awal hingga pengujian internal ribuan orang, kami mengizinkan pengguna bekerja sama dengan kami untuk menguji dan mengulangi produk.

"Nanti": Kedengarannya sangat berisiko. Bagaimana Anda bisa begitu yakin bahwa Anda akan mampu melewati proses ini?

Lang Xianpeng: Risikonya sangat tinggi, tapi kami selalu berada di sini.

Mobil pertama kami, Lideal ONE, menggunakan solusi mengemudi cerdas Mobileye. Belakangan, saat Ideal ONE facelift hendak dikirimkan, Mobileye mengatakan tidak akan bekerja sama lagi dan tidak bisa menyediakan pengiriman white box. Saat itu sudah tahun 2021, dan kami berpikir jika saat ini kami tidak menguasai teknologi Assisted Driving, pasti tidak akan berhasil. Jadi saya membuat keputusan sulit - buatlah sendiri. Jika kita tidak bisa melakukannya, itu karena kita tidak kompeten. Namun jika saat ini kita terlalu penakut dan masih menggunakan pemasok, maka kita mungkin tidak mempunyai masa depan.

Kami "dipaksa" untuk memikirkan proses penelitian dan pengembangan yang sangat berbeda. Proses ini disampaikan pada bulan Mei dan prototipenya harus diproduksi pada bulan Maret, pada tanggal 25 Mei 2021, sehari sebelum konferensi peluncuran Ideal ONE, kami masih memiliki banyak hal bug yang harus diselesaikan. Perubahan akhirnya selesai pagi itu. Ini adalah prototipe dari proses kami saat ini: pertama-tama verifikasi area kecil, lalu tingkatkan kemampuan, perbaiki bug, dan stabilkan kualitas.

Saat itu tim hanya berjumlah 100 orang, dan tersisa 40 orang di bulan pertama. Seseorang berkata kepada saya, "Mengapa kita bisa mewujudkan sesuatu yang membutuhkan waktu satu atau dua tahun bagi orang lain untuk bisa terwujud dalam tiga bulan? Jangan menipu diri sendiri."

"Terlambat": Hal yang sama tidak digambarkan. Xiaopeng membuka kota tahun lalu lebih lambat dari Anda tahun ini dan memiliki lebih banyak penguji. Xiaopeng mengatakan bahwa setiap kali pergi ke kota untuk membuka kota, ia harus melakukan setidaknya empat putaran lapangan pengujian. Hanya dengan cara ini dapat menjamin keamanan dan tidak memberikan Pengguna membuka kotak buta. Bagaimana Anda memastikan keamanan dengan metode pengembangan cepat, pengiriman, dan kemudian dari telur burung ke ribuan orang untuk pengujian internal?

Lang Xianpeng: Metode evaluasi sistem penggerak otonom saat ini sangat berbeda dari sebelumnya. Pada smart riding sebelumnya, fungsi dirancang terlebih dahulu lalu dikembangkan, dan setiap fungsi diuji untuk memverifikasinya. Penggerak otonom berbasis data saat ini didasarkan pada kemampuan, bukan fungsi.

Kami menggunakan model dunia + mode bayangan untuk mengikuti ujian. Model dunia direkonstruksi dan dihasilkan menjadi pemandangan nyata, dengan mobil berjalan di dalamnya, yang setara dengan uji simulasi untuk mengevaluasi kemampuan dalam proses penelitian dan pengembangan. Setelah lulus uji tiruan, kami menggunakan early bird, kendaraan uji internal, dan mode bayangan untuk mengikuti uji mobil sebenarnya. Jika Anda gagal, kami akan terus mengulanginya hingga Anda lulus.

"Terlambat": Jika ada jawaban pada esai proposisional, idealnya Anda dapat berlari lebih cepat dari yang lain, namun jawabannya tidak selalu tersedia.

Lang Xianpeng: Apa yang Anda lihat hari ini adalah apa yang disebut komposisi proposisi. Kami mengejar dengan cepat, tetapi setelah mengejar, kami mungkin lebih cepat karena seluruh sistem sudah diatur.

Ini tidak berarti bahwa kami baru akan memulai riset mandiri pada tahun 2021, sehingga kami dapat menghasilkan produk yang lebih buruk dibandingkan produk sejenis. Sejak hari pertama kami menyampaikan, kami harus bersaing dengan siswa terbaik di kelas. Artinya juga jika saya menggunakan metode belajar orang lain untuk belajar, saya pasti tidak akan bisa belajar darinya. Jadi kita hanya perlu melakukan segala sesuatunya dengan cara kita sendiri.

Di ambang tanah tak bertuan

"Nanti": End-to-end bukanlah konsep baru. Nvidia dan Waymo sama-sama mengusulkan end-to-end beberapa tahun yang lalu, tapi mengapa Tesla yang menerapkan dan mempromosikan ini?

Jia Peng: Karena tidak hanya mengedepankan ide teknis, tetapi juga menunjukkan kepada semua orang hasil penggunaannya.

Lang Xianpeng: Banyak orang di Tesla melihatnya karena mereka mempercayainya, tetapi lebih banyak orang yang mempercayainya karena mereka melihatnya.

"Terlambat": Jika Tesla tidak menjajaki jalan di depannya, apakah cita-citanya akan tertinggal lebih lama?

Lang Xianpeng: Secara algoritma, kami terlambat karena kondisi awal dan sumber daya tidak mencukupi. Namun belum terlambat untuk mengumpulkan data dan membangun sistem penelitian dan pengembangan agar kita bisa mengejar ketertinggalan.

Sejak awal, kami sudah memahami dengan jelas filosofi Tesla—data-driven adalah hal yang benar, jadi kami akan membangun infrastruktur R&D sesuai dengan filosofi tersebut. Pada generasi pertama Ideal ONE pada tahun 2019, kami membangun sistem loop tertutup data - Poseidon, seperangkat rantai alat untuk mengumpulkan, menambang, memberi label, dan melatih data. Kami tidak memiliki sumber daya untuk melakukan penelitian sendiri pada saat itu, namun kami juga menempatkan kamera tambahan di samping kamera Mobileye untuk mengumpulkan dan menganalisis masalah.

Misalnya, jika suatu masalah ditemui selama tes jalan raya, metode tradisionalnya adalah orang di dalam pesawat menuliskannya dan kemudian mengemudikannya hingga kejadian yang sama terulang kembali. Kami mengalami masalah. Data dapat disinkronkan kembali ke latar belakang. Pengujian belum selesai, data telah dianalisis, dan masalah bahkan sudah mulai diselesaikan. Apa yang dilakukan oleh perusahaan tradisional selama beberapa hari atau bahkan seminggu, mungkin dapat kita lakukan dalam satu jam.

Dalam hal akumulasi data, total jarak tempuh mengemudi otonom oleh pengguna ideal telah melampaui 2 miliar kilometer, dimana hampir 1 miliar kilometer di antaranya telah dikendarai oleh NOA. Tesla melakukannya lebih awal, memiliki jumlah pelanggan yang lebih banyak, dan memiliki jarak tempuh yang lebih jauh.

"Nanti": Apakah ini lebih merupakan desakan Li Xiang atau desakan Anda?

Lang Xianpeng: Kami sepakat. Ketika saya datang ke Ideal untuk wawancara pada tahun 2018, Li Xiang bertanya kepada saya, apa masalah utama yang perlu diselesaikan untuk akhirnya mewujudkan L4? Saya katakan data - tanpa sistem loop tertutup data, apakah itu sampel atau pertanyaan, efisiensi analisisnya tidak tinggi. Orang bisa menambang dan algoritma bisa dikembangkan, tapi kalau masalah data tidak terselesaikan pasti tidak akan terlaksana dengan baik.

"Terlambat": Weilai baru saja memproduksi AEB end-to-end secara massal belum lama ini; Apa perbedaan end-to-end antara masing-masing perusahaan?

Jia Peng: Arsitektur Xpeng 5.2 saat ini mirip dengan Wutu yang baru kami luncurkan pada bulan Juli. Persepsi adalah sebuah model, pengambilan keputusan adalah sebuah model, dan semuanya terhubung di tengah-tengah. ADS 3.0 yang dirilis Huawei juga tersegmentasi secara end-to-end.

Tesla adalah model dari persepsi hingga pengambilan keputusan. Versi terbaru kami juga mengintegrasikan persepsi dan pengambilan keputusan ke dalam satu model, dan telah mulai diuji dengan ribuan orang pada minggu ini.

"Terlambat": Apa perbedaan antara model persepsi dan pengambilan keputusan end-to-end dan segmented end-to-end? Siapa yang di depan?

Lang Xianpeng: Masih tergantung tujuannya. Model tersegmentasi lebih cocok untuk berkendara berbantuan level L2+, sedangkan model satu benar-benar bisa melakukan mengemudi otonom level L3 dan L4.

Karena meskipun tersegmentasi end-to-end telah menggantikan beberapa aturan dengan aturan berbasis data dalam modul pengambilan keputusan, masih ada aturan dalam keseluruhan proses. Hal ini pada dasarnya mirip dengan arsitektur penggerak cerdas sebelumnya, serta penelitian dan pengembangan prosesnya juga serupa, masih dibagi menjadi beberapa modul. Model yang satu tidak memuat aturan apa pun. Data sensor masuk dan lintasan yang direncanakan keluar. Ini murni berdasarkan data.

"Nanti": Bisakah Anda menjelaskan dalam satu kalimat apa nilai terbesar dari end-to-end?

Jia Peng: Dari sudut pandang pengguna, perilaku mengemudi menjadi lebih manusiawi, dan kontrol detail menjadi lebih lancar. Dari perspektif penelitian dan pengembangan, iterasi lebih efisien.

Lang Xianpeng: End-to-end adalah pertama kalinya data murni digunakan untuk menggerakkan kendaraan otonom. Metode penelitian dan pengembangan telah berubah dari fungsi dan skenario hingga peningkatan kemampuan sistem. selama sistem terus menjadi lebih kuat, ia akan memiliki kinerja yang melebihi ekspektasi.

"Terlambat": Bagaimana cara melatih model yang lebih cerdas dalam waktu yang lebih singkat?

Jia Peng: Data, terutama data berkualitas tinggi, sangatlah penting. Kami menyaring data terbaik dari 20 miliar kilometer data dari 800.000 pemilik mobil, melatih lebih dari 1 juta kilometer data, dan melampaui 5 juta kilometer pada akhir tahun.

Yang kedua adalah metode pelatihan. Berdasarkan pembelajaran imitasi, kami menambahkan pembelajaran penguatan agar model mengetahui apa yang salah.

Lang Xianpeng: Hal terakhir adalah daya komputasi. GPU ideal memiliki daya komputasi setara dengan 5.000 A100 dan A800. Jika Anda menyewa kartu, biayanya 1 miliar per tahun, yang membutuhkan keuntungan yang sehat untuk mendukungnya.

"Nanti": Anda telah berulang kali menekankan bahwa Anda dapat mengejar ketertinggalan karena Anda memiliki data, tetapi minggu ini He Xiaopeng berkata, "Jika seseorang mengatakan bahwa ia memiliki banyak mobil dan banyak data" untuk dapat melakukan mengemudi otonom, "Jangan percaya, itu benar-benar tidak masuk akal."

Lang Xianpeng: Kami juga berharap semua orang dapat memperlakukan produk secara objektif. Namun kita masih berada di era ketika Edison dan Tesla membuktikan apakah arus searah atau arus bolak-balik lebih baik. Satu orang menggunakan arus bolak-balik untuk menyetrum, dan yang lain menunjukkan bahwa tidak masalah menggunakan arus bolak-balik untuk mengalir ke tubuh manusia.

"Nanti": Tesla memiliki data terbanyak dan investasi terbesar dalam daya komputasi.

Jia Peng: Batasan Tesla saat ini adalah perangkat keras, karena daya komputasi HW 3.0 (perangkat keras penggerak cerdas generasi ketiga Tesla) adalah 144 TOPS, dan parameter model yang dapat didukungnya tidak akan terlalu besar jika Anda menambahkan terlalu banyak data, " Lupa yang membawa bencana”. Inilah sebabnya mengapa setelah pembaruan V12.4, beberapa adegan menjadi lebih baik, sementara yang lain menjadi lebih buruk, seperti adegan kosong yang mulai berpindah jalur secara acak.

"Nanti": Namun jika dilihat dari sudut pandang lain, FSD dapat berjalan dengan lancar di HW 3.0 yang diluncurkan pada tahun 2018, yang menunjukkan bahwa Tesla memiliki kemampuan yang kuat dalam menggabungkan software dan hardware.

Jia Peng: Ini sangat kuat. Namun menurut saya ada tantangan bagi FSD untuk masuk ke Tiongkok. Pertama, sebagian besar jalan di Amerika Serikat relatif sederhana; kedua, Tesla dapat memperoleh informasi topologi jalan di Amerika Serikat, yang tidak tersedia di Tiongkok. Jadi FSD sebenarnya adalah peta ringan, dan kita benar-benar tidak memiliki peta dan tidak memiliki informasi peta sebelumnya.

"Terlambat": Pada bulan Juli tahun ini, Dr. Gu Junli, yang pernah bekerja untuk Tesla dan Xpeng, mengatakan bahwa "kemajuan penelitian dan pengembangan Tesla 1,5-2 tahun lebih maju dari mengemudi pintar dalam negeri." apa kamu setuju?

Lang Xianpeng: Saya tidak setuju.

Versi yang tidak digambarkan mewakili batas atas aturan. End-to-end mewakili batas atas data-driven, tidak ada aturan di dalamnya, hanya model. Namun, mengemudi otonom tidak dapat dicapai tanpa gambar dan end-to-end, karena masih menyelesaikan masalah jangka panjang dan tidak dapat menangani situasi yang belum pernah dihadapi sebelumnya. Untuk mencapai L4, sistem harus belajar menghadapi skenario yang tidak diketahui. Kami percaya bahwa kemampuan ini harus diselesaikan dengan VLM, bukan secara end-to-end.

Jadi arsitektur baru kami adalah end-to-end + VLM. Yang pertama adalah sistem 1 untuk berpikir cepat - menangani sebagian besar skenario mengemudi yang memerlukan respons cepat; yang terakhir adalah sistem 2 untuk berpikir lambat dan pengambilan keputusan jangka panjang - dapat belajar Pelajari beberapa akal sehat untuk menghadapi situasi yang tidak diketahui, seperti mengidentifikasi lampu lalu lintas tidak beraturan yang tidak terlihat, berbagai bentuk marka jalur pasang surut, fitur sekitar sekolah, dll., dan beri tahu mobil sebelumnya bahwa ia tidak dapat masuk atau melambat.

Sistem 1 + Sistem 2, idealnya adalah menjadi yang pertama membangun arsitektur ini.

Jia Peng: Dilihat dari informasi publik, arsitektur teknis Tesla saat ini tidak memiliki VLM.

"Terlambat": Wayve, sebuah perusahaan self-driving Inggris yang diinvestasikan oleh Nvidia dan SoftBank, merilis Lingo-2 pada bulan April tahun ini. Ia juga menambahkan model bahasa besar ke mobilnya.

Lang Xianpeng: Ia tidak memiliki Sistem 1. Lingo-2 dan model cloud Wayve adalah model bahasa besar multi-modal, mirip dengan VLM. Idenya adalah suatu model memecahkan sistem 1 ditambah sistem 2. Namun, selama produksi massal, akan diketahui bahwa kekuatan komputasi Orin ada dan tidak dapat mendukung model besar Sistem 2. Wayve dapat melakukan hal ini karena ini bukan kendaraan yang diproduksi secara massal dan memerlukan server di belakang kendaraan untuk menjalankan Lingo-2.

Jia Peng: Inspirasi awal kami adalah sistem robot Google RT-1 dan RT-2, yang merupakan model VLA (Visual-Language-action), dan perilaku akhirnya juga dihasilkan oleh model tersebut. Ini mungkin akhir permainannya: jika perangkat keras saya cukup baik, secara teoritis saya dapat menjalankan VLA secara real-time.

"Nanti": Jadi inspirasinya bukan datang dari industri otomotif, tapi dari robotika?

Lang Xianpeng: Karena kami menganggap mengemudi otonom sebagai penerapan khas kecerdasan buatan. Solusi sistem ganda ini sebenarnya mengusulkan arsitektur kecerdasan yang diwujudkan secara universal, yaitu mengemudi secara otonom di dalam mobil dan robot cerdas di dalam robot.

"Terlambat": Arsitektur "end-to-end + VLM" yang Anda usulkan, yang pertama terinspirasi oleh Tesla, dan yang terakhir terinspirasi oleh Google RT, dan makalah VLM merupakan kolaborasi dengan Universitas Tsinghua. Apakah ini berarti Anda sudah lebih terbiasa dengan inovasi kombinasi pada tahap ini?

Lang Xianpeng: Saat bekerja sama dengan Profesor Zhao Xing dari Universitas Tsinghua, pendapat kami saling bertabrakan, dan bukan dia yang mengemukakan pendapat tersebut, tetapi kami yang menerapkannya.

"Nanti": Anda menganggap mengemudi otonom sebagai bagian dari kecerdasan universal. Apakah ia juga memiliki Hukum Penskalaan, dan apakah Anda percaya pada Hukum Penskalaan?

Lang Xianpeng: Hukum Penskalaan end-to-end tidak akan terlalu jelas, karena parameternya terbatas, dan puluhan juta data mungkin terisi, dan jika Anda menambahkan lebih banyak data, itu akan mulai dilupakan sudah melihat fenomena ini dari Tesla FSD V12.4.

Namun Hukum Penskalaan VLM pasti ada, dan dapat mencapai puluhan miliar atau bahkan ratusan miliar parameter. Selama terdapat cukup data dan parameter yang cukup besar, maka performa akan meningkat. Jalan ini sangat menarik bagi kami.

"Terlambat": Jika VLM dapat berjalan cukup cepat dan memiliki latensi yang cukup rendah pada mobil, apakah Sistem 1 tidak diperlukan?

Jia Peng: Secara teoritis ya. Sekarang VLM kita dapat mencapai 3,4 HZ pada mobil (Catatan: HZ adalah jumlah kejadian periodik yang terjadi per satuan waktu. Semakin besar nilainya, semakin kecil penundaannya). Ini adalah model dengan parameter 2,2B (2,2 miliar), tetapi Untuk dapat menggantikan end-to-end, kecepatannya harus lebih dari sepuluh HZ, yang setara dengan penundaan 100-200 milidetik, yang merupakan kecepatan reaksi manusia. Skenario tertentu memiliki persyaratan latensi yang lebih tinggi, seperti AEB (pengereman darurat).

"Nanti": Seberapa unikkah struktur ini? Huawei juga berbicara tentang Sistem 1 dan 2; "Model Bahasa Besar XBrain" Xiaopeng juga membahas skenario yang tidak diketahui.

Lang Xianpeng: Kami adalah yang pertama mengusulkan sistem ganda di industri; dan VLM kami diterapkan pada chip sisi mobil Orin X yang diproduksi secara massal. Upaya serupa sebelumnya dilakukan oleh perusahaan lain pada komputer industri.

Baik itu satu model end-to-end atau VLM, arsitektur ini telah dikirimkan dan diuji oleh ribuan orang.

"Nanti": Anda juga menyebutkan bahwa Anda sedang mengerjakan model dunia cloud. Peran apa yang dimainkannya dalam keseluruhan arsitektur?

Jia Peng: Ini adalah sistem kami 3. Model dunia cloud melakukan dua hal: Pertama, VLM dapat disaring dari model dunia cloud, yang pertama-tama melatih model yang sangat besar di cloud, seperti parameter 400 B Lamma 3.1 yang baru-baru ini dirilis oleh Meta, dan kemudian menyaring model dunia cloud. Model 8 B. Ini berfungsi lebih baik daripada melatih model 8 B dari awal.

Kedua, model dunia dapat menguji kemampuan Sistem 1 dan Sistem 2. Dalam proses melakukan pengujian tanpa peta secara end-to-end, kami menemukan bahwa verifikasi secara nasional sangat sulit. Terdapat 10 juta kilometer jalan, dan sebelumnya kami hanya dapat mengerahkan tenaga untuk mengujinya.

"Terlambat": Tesla juga sedang mengerjakan model dunia. Namun apakah industri ini membutuhkan begitu banyak model dunia? Bagaimanapun kita hanya memiliki satu dunia.

Lang Xianpeng: Dalam proses dari 0 ke 1, akan ada banyak rute dan upaya. Sama seperti kita tidak membutuhkan begitu banyak merek kendaraan listrik, tetapi ada ratusan merek pada saat puncaknya.

"Kemudian": Industri sebelumnya percaya bahwa peringkat mengemudi cerdas di Tiongkok adalah Huawei, Momenta, Xpeng, dan Ideal. Kapan peringkat ini akan ditulis ulang? Dan apa poin selanjutnya yang akan mengubah peringkat mengemudi cerdas?

Lang Xianpeng: Telah ditulis ulang. Di masa depan, setiap tim akan pergi ke tanah tak bertuan: jika Wutu menyelesaikan masalah dan dapat dibuka secara nasional, dan secara end-to-end akan memungkinkan seluruh negara untuk terbuka dengan baik, maka langkah selanjutnya adalah L4.

Bagaimana cara memproduksi L4 secara massal? Pasti ada seratus bunga yang mekar pada awalnya, dan kemudian akan menyatu. Namun semua orang tidak akan kembali ke garis awal yang sama, karena kesenjangan data dan daya komputasi hanya akan semakin lebar.

Tinjauan Enam Pertarungan Kunci dalam Mengemudi Ideal dan Cerdas

"Nanti": Saya mendengar bahwa Anda pandai memberi nama pertempuran.

Lang Xianpeng: Kami menganggap serius pemberian nama.

Tim pengemudi yang cerdas melakukan enam pertempuran penting. Pertempuran pertama adalah Proyek Acropolis, kemudian Proyek Iliad dan Proyek Odyssey, bagian pertama dan kedua dari epik Homer; kemudian Proyek Titan, Proyek Golden Apple, dan setelah Pertempuran Titan, Dewa Baru mengalahkan para dewa lama. Sekarang mari kita beralih ke Proyek Damocles saat ini, yang merupakan proyek end-to-end. Proyek ini menantang dan berbahaya. Jika tidak dilakukan dengan baik, Pedang Damocles akan jatuh.

"Terlambat": Apa tantangan dan imbalan terbesar dalam setiap pertempuran?

Lang Xianpeng:

  • Project Acropolis adalah proyek penelitian mandiri pertama kami - memberikan fungsi dasar seperti AEB, pelayaran adaptif ACC, dan pemeliharaan jalur pada Ideal ONE yang dirilis pada Mei 2021. Teknologi ini sudah matang, tetapi kami hanya diberi waktu 90 hari, yang penting adalah eksekusi yang kuat. Sejak hari itu, kami memikirkan bagaimana kami dapat mengejar ketertinggalan dengan cepat.
  • Pada tahun 2022 kami akan memulai program Iliad - melaksanakan proyek Orin X pada model L9. Algoritma sebelumnya di Horizon J3 sudah tidak berlaku lagi, dan kami perlu mengembangkan kembali sistem di Orin. Selain itu, pasokan chip juga terhenti, dan Bosch tidak mampu menyediakan chip radar gelombang milimeter sudut dalam jumlah yang cukup. Kami harus membuat pilihan untuk menghilangkan radar gelombang milimeter sudut dan menggunakan solusi visual murni untuk deteksi titik buta, penghindaran rintangan, dan fungsi lainnya. Pada akhirnya, butuh waktu tiga bulan untuk menyampaikan solusinya, beberapa bulan lebih awal dari waktu yang dibutuhkan teman tersebut untuk mengantarkan Orin.
  • Bersamaan dengan Iliad, Jia Peng bertanggung jawab mengembangkan platform Pro berdasarkan Horizon J5, yaitu Proyek Odyssey. Tantangan terbesarnya adalah jumlah orang yang sedikit. Saat itu, seluruh tim hanya beranggotakan 500 orang. Pada tahun 2021, baik Xiaopeng maupun Weilai beranggotakan ribuan orang, dan Huawei mengklaim saat itu memiliki lebih dari 2.000 orang.
  • Pada tahun 2023, platform Orin kami menjadi relatif stabil dan mencapai keseimbangan dalam hal perangkat keras. Kami menilai bahwa pertempuran berikutnya adalah NOA perkotaan, dan hanya mereka yang menang yang berhak memasuki tingkat pertama. Ini disebut Proyek Titan.
  • Proyek Apel Emas adalah NOA seratus kota yang diusulkan pada Shanghai Auto Show 2023. Itu juga berasal dari mitologi Yunani. Hercules pergi mencari apel emas, tetapi apel emas itu dijaga oleh naga berkepala seratus apel emas, kita harus Memotong kepala naga raksasa itu satu per satu, dan melenyapkan ratusan kota satu per satu.
  • Proyek Damocles merupakan proyek end-to-end yang dimulai tahun ini, artinya Pedang Damocles akan tumbang jika tidak dikerjakan dengan baik.

"Nanti": Perusahaan lain belum menghapus radar gelombang milimeter empat sudut. Sudahkah Anda mempertimbangkan dampaknya terhadap keamanan sistem setelah menghapusnya?

Lang Xianpeng: Kami menghapus radar gelombang milimeter karena dua alasan. Pertama adalah untuk memastikan pengiriman. Pada saat itu, pasokan chip radar Bosch Corner terputus dan kami harus membuat pilihan. Entah mengganti radar dengan visi, atau gagal mewujudkannya. Kedua adalah pemilihan teknologi. Saat itu, Tesla ingin mengadopsi solusi visual murni. Jika terdapat radar gelombang milimeter sudut dan sensor visual pada bodi mobil, dan terdapat perbedaan di antara keduanya, maka perlu menggunakan logika aturan yang ditulis manusia untuk menilainya, dan kesalahan pasti akan terjadi.

Manfaat tambahan lainnya adalah teknologi ini mengurangi biaya dan menghemat sekitar 500 juta.

Namun, sangat sulit dan berisiko menggunakan beberapa kamera untuk menggantikan radar gelombang sudut milimeter. Kami telah melakukan banyak pengujian, dan hasil akhirnya adalah akurasi dan tingkat keberhasilan sedikit lebih tinggi dibandingkan radar sudut.

"Nanti": Anda menyebutkan masalah sumber daya yang tidak mencukupi sebelumnya. Apakah masalah ini sudah terpecahkan sekarang?

Lang Xianpeng: Kami mengusulkan “tiga strategi utama” pada pertemuan strategi musim gugur September lalu. Jadi kami mulai merekrut banyak orang pada paruh kedua tahun ini. Persyaratan dan ekspektasi perusahaan juga meningkat. Baik itu di seratus kota atau lainnya, perusahaan harus mengejar eselon teratas.

"Nanti": Jadi mengemudi dengan cerdas bukanlah strategi inti yang ideal sebelumnya?

Lang Xianpeng: Kali ini secara resmi sudah jelas.

"Nanti": Apakah ini karena Anda menyadari bahwa dampak berkendara cerdas terhadap penjualan produk semakin meningkat, dan jarak antara Anda dan Huawei semakin lebar?

Jia Peng: Ya, jadi strategi musim gugur 2023 akan menentukan bahwa kami idealnya akan menjadi pemimpin mutlak dalam mengemudi cerdas tahun ini, karena kami menilai logika pembelian mobil di seluruh industri akan menjadi mengemudi cerdas terlebih dahulu.

"Nanti": Apa yang Anda kumpulkan dari enam pertempuran?

Lang Xianpeng: Jika Anda ingin menang, Anda harus memikirkan cara untuk menang. Artinya, mulailah dengan memikirkan tujuan akhir, temukan kebutuhannya, dan cari tahu apa yang perlu dilakukan untuk memecahkan suatu masalah. Radar yang dihilangkan sudutnya dan peta cut-off NPN adalah contohnya.

"Terlambat": Bukankah titik awal cita-cita didasarkan pada persaingan? Misalnya saja lomba Proyek 100 Kota tahun lalu.

Lang Xianpeng: Tahun lalu, setelah Huawei mengumumkan akan meluncurkan ADS (solusi NOA tanpa peta Huawei) yang dapat dibuka secara nasional, kami terlalu menekankan persaingan dan membandingkan beberapa indikator Huawei, seperti tingkat pengambilalihan, tetapi mengabaikan pengalaman pengguna juga terjadi pada musim semi ini.

Kemudian, kami merefleksikan bahwa semua penerimaan dan pengiriman produk harus didasarkan pada evaluasi pengguna.

"Nanti": Bagaimana Anda merancang R&D mengemudi cerdas dan organisasi produk untuk menghadapi persaingan dengan intensitas tinggi saat ini?

Lang Xianpeng: Mengemudi cerdas kami adalah organisasi horizontal dan vertikal, saya bertanggung jawab atas departemen bisnis vertikal, melakukan penelitian, pengembangan, dan pengiriman. Namun, pengorganisasian, pelaksanaan, dan pengoperasian produk akhir, termasuk pembandingan kompetitif eksternal dan investasi sumber daya penelitian dan pengembangan, semuanya ditangani oleh PDT (Tim Pengembangan Produk, tim pengembangan produk lintas fungsi) yang menjadi penggerak cerdas.

Saya akan berpartisipasi dalam perumusan beberapa strategi dan rencana talenta. Setelah rencana tersebut diselesaikan, kami akan menerapkannya dengan tegas.

"Terlambat": Musim gugur yang lalu, Ideal mempekerjakan orang dalam skala besar, dan tim pengemudi cerdas berkembang dari lebih dari 700 orang menjadi lebih dari 1.000 orang pada bulan Mei tahun ini, mereka memberhentikan dua hingga tiga ratus orang lagi, dan pada bulan Juni pihaknya menarik kembali beberapa karyawan di posisi-posisi penting. Apa artinya beralih dari perekrutan ke pemberhentian dan kemudian memanggil kembali karyawan dalam waktu singkat?

Lang Xianpeng: Intinya adalah iterasi teknologi. Di masa lalu, ada banyak sekali aturan dalam sistem mengemudi cerdas, yang memerlukan pemrograman manual, manajemen kemajuan, dan pengujian. Namun end-to-end lebih berkaitan dengan model AI, dan posisi yang disebutkan di atas telah berkurang secara signifikan. Belakangan, ada beberapa orang yang dipanggil kembali, sebagian besar berdasarkan penyesuaian berdasarkan kebutuhan bisnis. Faktanya, tim pengemudi cerdas Tesla selalu terdiri dari 200 hingga 300 orang, dan telah menghasilkan armada pengemudi otonom terbesar di dunia.

"Terlambat": Tesla end-to-end pertama kali diusulkan secara internal oleh teknisi India, Dhaval Shroff, dan diadopsi dari bawah ke atas. Apakah organisasi penelitian dan pengembangan yang ideal mempunyai landasan bagi inovasi dari bawah ke atas?

Lang Xianpeng: Faktanya, ide untuk VLM ini datang dari tim pra-penelitian dan R&D kami. Kami tidak merencanakan sistem ganda seperti itu sejak awal.

"Nanti": Bagaimana Anda mengevaluasi kumpulan bakat Anda? Sebelum Xiaopeng, ada Wu Xinzhou, dan Weilai memiliki Ren Shaoqing. Beberapa orang percaya bahwa tim pengemudi cerdas yang ideal selalu kekurangan ahli teknis seperti itu.

Lang Xianpeng: Pada level ini, baik kemampuan teknis maupun kemampuan mendapatkan hasil adalah penting. Banyak pemimpin teknis kami, termasuk saya, Jia Peng, dan Wang Jiajia, telah mengerjakan kendaraan otonom pada tahun 2014 atau 2015. Rekrutmen baru kami juga relatif kuat. Lebih dari 200 lulusan baru tahun ini sebagian besar termasuk dalam 50 mahasiswa terbaik di QS100 (British QS World University Rankings). Dan kita memiliki daya komputasi dan cadangan data, yang merupakan landasan bagi pertumbuhan bakat.

"Terlambat": Meskipun Anda memasuki bidang mengemudi cerdas sejak awal, Anda awalnya mengerjakan algoritme terkait peta di Baidu, bukan mengemudi cerdas itu sendiri.

Lang Xianpeng: Pengalaman Baidu sangat penting. Pengalaman itu membuat saya tidak takut pada apapun dalam manajemen. Saya yakin jika saya menemukan metode yang tepat, saya bisa mencapai hasil yang lebih baik dalam waktu yang lebih singkat.

Proyek pertama saya di Baidu mirip dengan penelitian mandiri generasi pertama Ideal karena siklusnya sangat ketat. Saya bergabung dengan Baidu pada akhir April 2013, dan proyek street view akan diluncurkan pada Konferensi Baidu empat bulan kemudian. Awalnya hanya ada 4 orang di tim ini, dan kami akhirnya menyelesaikan peluncurannya pada tengah malam sehari sebelum konferensi.

Ada dua kunci di sini. Salah satunya adalah dengan menggunakan teknologi baru. Saat melakukan pemandangan jalanan, Anda perlu memburamkan pelat nomor dan wajah. Metode konvensional saat itu adalah melakukannya secara manual; namun kami menggunakan algoritme visual, yang lebih cepat dan akurat, serta menghemat banyak orang. Yang lainnya adalah data. Untuk algoritma ini, awalnya kami ingin bekerja sama dengan tim Yu Kai (kemudian pendiri Horizon) dan Ni Kai (kemudian pendiri Heduo) dari Baidu IDL, tetapi algoritma mereka hanya memiliki akurasi 86% dalam skenario ini membuat plat nomor sendiri 99%, 97% wajah. Kuncinya adalah kami menandai puluhan ribu data.

Secara algoritma, kita pasti tidak sebaik mereka. Mereka adalah orang-orang dengan algoritma terbaik di dunia. Tapi ini hanya selisih 80 hingga 90 poin; dalam hal data pemandangan, kami memiliki urutan yang lebih besar. Jadi saat wawancara nanti, Li ingin bertanya kepada saya, apa masalah terpenting dalam menyelesaikan mengemudi otonom? Saya akan mengatakan data.

"Nanti": Dalam beberapa tahun terakhir, banyak orang memilih keluar karena tidak tahan tekanan atau tidak percaya cita-citanya bisa tercapai. Mengapa pada akhirnya tetap bertahan?

Lang Xianpeng: Kami, sekelompok orang, hanya ingin mewujudkan L4, dan menurut saya ini hanya bisa dilakukan secara ideal.

Jia Peng: Sebelum datang ke Ideal, saya tinggal di NVIDIA selama 5 tahun. Baik itu model end-to-end atau besar, NVIDIA adalah yang pertama mengusulkannya, tetapi tidak diterapkan pada saat itu. Ketika saya bergabung dengan sebuah perusahaan mobil, saya akhirnya memiliki kesempatan untuk menjadikan mengemudi otonom sebagai sebuah loop tertutup, dan itu sangat bagus.

Sumber gambar judul: "Genius Gunner"