dialog dengan ideal lang xianpeng: kami sudah berada di depan tesla

dialog dengan ideal lang xianpeng: kita sudah berada di depan tesla

2024-08-31

ceo tesla elon musk meluncurkan siaran langsung perangkat lunak mengemudi cerdas tesla fsd v12 pada tahun 2023 - tesla dalam video tersebut didasarkan pada teknologi end-to-end terbaru, dan perangkat lunak tersebut telah menghapus sejumlah besar insinyur. kode aturan, sebagai gantinya menggunakan algoritma jaringan saraf utama. kendaraan ini didasarkan pada visi otonom dan jaringan saraf untuk menunjukkan di mana harus memperlambat, mengidentifikasi lampu lalu lintas, dan siapa pun di jalan, dan membuat keputusan secara otonom.

teknologi ini kemudian memicu diskusi dan minat yang besar dari kalangan industri, pecinta teknologi, bahkan konsumen mobil biasa.

ini adalah babak baru pemulihan paradigma berkendara cerdas. hingga saat ini, masih banyak pendapat yang muncul di pasar tiongkok:

munculnya teknologi end-to-end telah menjadi titik awal bagi banyak perusahaan mobil yang bergerak di bidang mengemudi cerdas. semua orang kini berada di titik awal lagi, memulai perlombaan jarak jauh dalam hal data dan daya komputasi.

teknologi end-to-end dipengaruhi oleh data yang kuat. konstruksi model dan kuantitas akuisisi data, terutama perolehan data berkualitas efektif, mempengaruhi cepatnya iterasi teknologi.

di pasar cina, pembuat mobil independen dengan "keunggulan dalam negeri" telah memulai perlombaan jarak jauh untuk berkendara cerdas. pada saat yang sama, ada banyak pendapat bahwa keunggulan fsd tesla akan terhapus pada tahap ini.

lang xianpeng, wakil presiden litbang mengemudi cerdas li auto, juga percaya bahwa,dari segi arsitektur teknis, solusi terbaru ideal tidak jauh berbeda dengan solusi tesla, dan bahkan sedikit lebih maju. karena idealnya memiliki model vlm dan sistem 2, tesla hanya memiliki sistem 1 end-to-end.

model end-to-end li auto adalah one model yang terintegrasi end-to-end, yang sedikit berbeda dari end-to-end perusahaan mobil lain di pasar.

teknologi end-to-end konvensional hanya menggunakan model kecerdasan buatan dan pembelajaran mandiri mekanis untuk menggantikan modul persepsi, perencanaan, dan kontrol dalam proses mengemudi cerdas, dari ujung "input" visual hingga sistem mengemudi cerdas dan kendali akhir kendaraan. . sisi "output" mengemudi sepenuhnya ditangani oleh model. teknologi murni "end-to-end" tidak lagi menetapkan kode berbasis aturan dalam proses ini dan menjadi kotak hitam yang lengkap.

namun, banyak perusahaan mobil di pasar, termasuk pabrikan yang relatif maju seperti tesla, huawei, dan xpeng, masih menyiapkan algoritme dasar tertentu yang bertanggung jawab atas redundansi keamanan. pengendalian persepsi dan perencanaan mungkin merupakan modul yang relatif independen, dan antarmuka masih perlu ditentukan dan dihubungkan secara manual.

one model end-to-end yang terintegrasi dimaksudkan untuk menyatukan modul kontrol persepsi dan perencanaan. idealnya disebut sistem 1 secara internal dan lebih seperti pendorong untuk mengeksekusi keputusan end-to-end dengan cepat.

di masa lalu, aplikasi end-to-end di bidang berkendara cerdas sering kali menghadapi masalah batas atas yang tinggi tetapi juga batas bawah yang rendah. misalnya, tesla, pemimpin industri, melakukan pengujian dengan sangat lancar di california, as, dan berperilaku seperti pengemudi manusia. namun, begitu memasuki area yang asing, keputusan regulasi akan sulit dijelaskan.

ini adalah salah satu kelemahan end-to-end.

pendekatan yang ideal adalah dengan memperkenalkan sistem 2, model bahasa visual vlm, dan mengambil langkah maju.

idealnya, model bahasa visual vlm adalah model besar pertama di dunia yang berhasil diterapkan pada chip sisi mobil, dan memiliki kemampuan untuk menangani pemikiran logis dan pengambilan keputusan dalam skenario yang kompleks.

selain one model end-to-end, sistem 2 - vlm adalah kumpulan algoritma model lain yang membantu sistem 1 dalam perencanaan dan pengambilan keputusan. sistem 2 berbasis vlm dapat memberikan kemampuan memahami lingkungan yang kompleks, kemampuan membaca peta navigasi, dan kemampuan memahami peraturan lalu lintas.

lang xianpeng memberikan penjelasan yang lebih populer pada kombinasi ini: sistem 1 seperti pengemudi, dan sistem 2 adalah instruktur sekolah mengemudi. sistem 1 bergantung sepenuhnya pada persepsi visualnya sendiri untuk melakukan operasi. sistem 2 perlu mengumpulkan pengetahuan dalam jangka waktu yang lama untuk mengingatkan dan menginformasikan sistem 1.

zhan kun, pakar algoritma canggih untuk mengemudi cerdas li auto, dan timnya adalah orang pertama yang mengusulkan konsep ini. mengikuti contoh daniel kahneman, seorang psikolog kognitif dan pemenang hadiah nobel, ia percaya bahwa otak manusia memiliki dua sistem. sistem pertama didasarkan pada pengalaman dan intuisi, dan sistem kedua mempelajari dan mengumpulkan pengetahuan secara komprehensif.

kedua sistem ini menyajikan keseluruhan solusi berkendara cerdas ideal, yang juga menjadikan solusi berkendara cerdas ideal benar-benar berbeda dari perusahaan mobil lainnya.

di pasar amerika, tesla fsd adalah pemimpin dalam hal daya komputasi dan data.

namun di pasar tiongkok, strategi yang ideal tampaknya adalah menciptakan kembali “china tesla smart driving road” untuk memposisikan dirinya lebih maju.

lang xianpeng berkata, "dalam hal kekuatan komputasi pelatihan dan data pelatihan tiongkok, kami yakin bahwa setidaknya mulai saat ini, kami berada di depan tesla, karena tesla masih mengalami beberapa kendala di tiongkok dalam hal kepatuhan data dan penerapan daya komputasi akan dibangun di tiongkok.”

ideal juga memperkenalkan sistem model dunia dalam proses pengujian data.

ideal mengatakan bahwa model dunia mendukung iterasi berskala besar dan berkecepatan tinggi dari generasi baru berkendara cerdas ideal, menyediakan sistem evaluasi kemampuan ai otomatis, menggunakan teknologi rekonstruksi untuk mengubah skenario masalah yang dihadapi pengguna menjadi "kumpulan pertanyaan yang salah". , dan menggunakan teknologi generasi untuk mengubah pengguna menjadi "kumpulan pertanyaan yang salah". adegan mengemudi yang sebenarnya digunakan sebagai "pertanyaan simulasi". kedua teknologi tersebut memastikan bahwa pertanyaan yang salah tidak lagi dilakukan secara salah selama evaluasi model, dan keduanya juga memiliki kemampuan generalisasi yang sangat baik .

berdasarkan solusi teknis model dunia ideal one model+vlm+, hal ini juga membawa generasi baru produk penggerak cerdas ideal ke tahap baru "pengemudi otonom yang diawasi".

ideal adalah perusahaan pertama yang menerapkan vlm pada chip orin-x dan perusahaan mobil pertama yang mengadopsi arsitektur sistem ganda. di tiongkok, ideal sudah memiliki volume penjualan mendekati satu juta, yang tentunya akan meningkatkan proporsi data yang efektif. akumulasi jarak tempuh pelatihan li auto saat ini telah melebihi 2,2 miliar kilometer, dan diperkirakan akan melebihi 3 miliar kilometer pada akhir tahun 2024. daya komputasi pelatihan li auto saat ini telah mencapai 5,39 eflops, dan diperkirakan akan melebihi 8 eflops pada akhir tahun 2024.

namun, industri ini masih memperdebatkan penerapan dan prospek teknologi end-to-end - beberapa orang berpikir bahwa mengemudi cerdas tidak dapat dicapai tanpa 50 miliar, sementara yang lain percaya bahwa setidaknya dalam beberapa tahun ke depan, end-to-end algoritma model berbasis aturan dan fungsi modul tunggal akan tetap paralel, murni end-to-end masih omong kosong.

sampai batas tertentu, hasil pengujian grup pengalaman pengguna ideal telah memverifikasi rasionalitas jalur ini saat ini. bagaimanapun, li auto memimpin dalam mengambil langkah ini.

lang xianpeng, wakil presiden litbang mengemudi cerdas di li auto, dan zhan kun, pakar algoritma senior di li auto intelligent driving

berikut adalah singkatan percakapan dengan dr. lang xianpeng, wakil presiden penelitian dan pengembangan intelligent driving li auto, dan zhan kun, pakar algoritma senior li auto intelligent driving. percakapan telah diedit tanpa mengubah arti aslinya:

pertanyaan: semua orang di pasar mengatakan bahwa mereka end-to-end sebenarnya.

zhan kun:end-to-end adalah paradigma penelitian dan pengembangan. seperti namanya, ini mengacu pada melakukan suatu tugas dari akhir masukan awal hingga akhir keluaran akhir proses dari input ke output. ini end-to-end arti penting dari end-to-end, asalkan memenuhi makna ini, kita bisa menyebutnya end-to-end.

sekarang mobil ideal adalah one model yang terintegrasi secara end-to-end. melalui input sensor langsung, setelah inferensi model selesai, perencanaan lintasan langsung digunakan untuk mengendalikan mobil langkah-langkah lain di antaranya. ada juga metode end-to-end, yaitu membagi dua model di tengah-tengah. sinyal digunakan sebagai jembatan antar model. inputnya adalah model persepsi. dan keduanya digabungkan menjadi model end-to-end yang modular, hal ini juga bisa disebut end-to-end, namun kami percaya bahwa end-to-end tersebut tidak benar-benar end-to-end. . li auto end-to-end sendiri ingin mengatasi hilangnya informasi perantara. jika proses pencernaan informasi buatan ditambahkan di tengah, efisiensinya mungkin tidak terlalu tinggi atau batas atas kemampuannya mungkin dibatasi bahwa integrasi end-to-end adalah end-to-end yang lebih penting.

pertanyaan: apakah kita terinspirasi oleh tesla? apakah ada perbedaan dibandingkan dengan modul tradisional secara end-to-end?

zhan kun:tesla memang menyebutkan end-to-end pada awal tahun 2023, dan musk mengatakan di twitter bahwa itu mewujudkan model lengkap pengendalian mobil langsung dari input hingga output. semua orang kaget saat melihat berita ini, karena mereka tidak sekadar mengusulkan hal tersebut. pada tahun 2016, nvidia memiliki model yang menyebutkan end-to-end dan menerbitkan makalah, namun efeknya rata-rata dan hanya menyelesaikan masalah. dalam skenario yang sangat sederhana, mengingat kekuatan komputasi dan skala model pada saat itu, semua orang menganggap jalur ini tidak mungkin dilakukan.

pada tahun 2023, kekuatan komputasi super besar akan ditambahkan ke arsitektur transformator baru. setelah tesla membangunnya, paradigma baru mungkin akan bangkit kembali. end-to-end bukanlah hal pertama yang diusulkan tesla, tetapi hal ini berkembang ke arah yang lebih berkembang. setelah melihat hal ini, kami juga berpikir secara internal. dibandingkan dengan model modular sebelumnya, pendekatan end-to-end lebih penting untuk mengurangi redundansi berbagai informasi. pada model tanpa grafik, kami mendekati modular end-to-end. kami memiliki model persepsi besar, yang sebenarnya merupakan model modular end-to-end. meski begitu, kami menemukan bahwa model end-to-end masih memerlukan aturan, dan masih ada data yang dibagi menjadi beberapa modul dan tugas kebijakan dibagi menjadi beberapa modul.

kali ini, dalam diskusi dan konsepsi solusi baru, kami mengusulkan bahwa solusi end-to-end harus lebih menyeluruh dan esensial. li auto memiliki data yang sangat kaya, dan kami yakin data ini dapat mendukung kami dalam melakukan pekerjaan dengan baik. jadi kami memilih arsitektur terintegrasi end-to-end yang lebih menantang dan sulit. batas atasnya sangat tinggi, namun kelemahannya adalah lebih sulit untuk melatih modul skor, termasuk rasio data dan metode pelatihan banyak pengetahuan untuk dijelajahi dan penggalian, tetapi kami tetap dengan tegas memilih jalan yang sulit namun benar.

pertanyaan: banyak merek sekarang mengklaim sebagai pemimpin, dan li auto juga mengatakan bahwa mereka telah memasuki eselon pertama dalam mengemudi cerdas. bagaimana cara mengevaluasi tingkat teknis ujung ke ujung dari perusahaan-perusahaan ini di pasar?

lang xianpeng:dari segi teknis, bagi konsumen awam, mereka tidak peduli apakah ada gambar atau tidak, end-to-end atau non-end-to-end. yang pada akhirnya menjadi fokus setiap orang adalah produk dan pengalaman penggunaan itu, serta nilai produknya. oleh karena itu, kami tidak mencoba untuk bersaing dengan siapa pun, namun kami berharap dapat memberikan produk dan layanan yang lebih baik kepada pengguna kami. di masa lalu, noa berkecepatan tinggi digunakan dengan peta presisi tinggi, dan pengalaman noa berkecepatan tinggi memenuhi kebutuhan pengguna. selanjutnya, kami mencoba banyak metode dalam proses pembuatan noa kota. salah satu ide yang sangat sederhana adalah menggunakan peta untuk membuat noa kota. namun, kami menemukan bahwa tidak ada dealer peta yang dapat menyediakan peta kota dengan presisi tinggi. berikan gambar yang terang. namun kami percaya bahwa grafik cahaya tidak layak dilakukan, karena ketika grafik berulang diperlukan, masalah akan muncul dalam ketepatan waktu dan apakah grafik tersebut benar-benar dapat digunakan. kami tidak bisa membiarkan pengguna merasa bahwa tempat yang tersedia saat ini tidak akan tersedia besok.

pada akhirnya, kami memutuskan untuk melakukannya tanpa gambar. solusi tanpa gambar sebelumnya didasarkan pada persepsi, perencanaan, dan solusi sub-modul, yang mencakup sejumlah besar aturan manual dan pengujian kendaraan yang sebenarnya, belum lagi investasi anggaran, yang sangat sulit dari segi waktu. ketika model diiterasi, jika ingin dijalankan melalui berbagai kondisi sepanjang tahun, tidak akan mungkin dilakukan dalam satu atau dua tahun, dan pengguna tidak bisa menunggu selama itu. jadi kami beralih ke arsitektur teknis end-to-end + vlm. menurut saya, solusi teknis ini pada dasarnya adalah solusi kecerdasan buatan.

selain itu, hari ini saya memperkenalkan kepada anda konten model dunia. menurut pendapat saya, kemampuan ini adalah jaminan paling penting dan diperlukan untuk mencapai iterasi cepat dalam berkendara otonom.perulangan model memerlukan sejumlah besar kendaraan, orang, dan waktu untuk diuji dengan cara tradisional, namun sekarang kami menggunakan teknologi pembangkitan dan rekonstruksi untuk mengumpulkan adegan di mana masalah terjadi di masa lalu dan membangun perpustakaan skenario adegan yang salah.sebelum setiap peluncuran, lebih dari 10 juta kilometer pengujian dilakukan terhadap pertanyaan-pertanyaan sederhana yang salah, dan ini adalah serangkaian pertanyaan salah yang efektif, bukan tes jalan acak. selain itu, kami juga dapat membuat skenario dan mensimulasikan skenario, yang juga merupakan puluhan juta pengujian skenario. iterasi model dengan cara ini kini jauh lebih andal dibandingkan metode pengujian kendaraan atau jalan asli, dan dapat mencakup berbagai skenario sepanjang tahun. ini adalah pendekatan kami. kami tidak tahu apakah merek lain melakukan hal ini, tetapi kami sepenuhnya didasarkan pada kebutuhan pengguna. kami melakukan iterasi pada teknologi, bukan demi teknologi, namun karena teknologi ini benar-benar dapat memenuhi kebutuhan pengguna dan menghadirkan pengalaman produk yang lebih baik, maka kami akan melakukan ini.

pertanyaan: belum lama ini, seseorang mengemukakan gagasan bahwa "tidak mungkin melakukan mengemudi yang cerdas tanpa 50 miliar".

lang xianpeng:mengenai 50 miliar, anda perlu menilai apakah itu investasi satu kali atau investasi jangka panjang. seperti disebutkan hari ini, kami menginvestasikan 1 miliar dolar as dalam penelitian dan pengembangan mengemudi cerdas setiap tahun. itu akan melebihi 50 miliar.

arsitektur teknis end-to-end + vlm adalah titik balik.sebelumnya, kami masih menggunakan metode tradisional untuk mengemudi secara otonom. mulai generasi ini, kami benar-benar menggunakan kecerdasan buatan untuk mengemudi secara otonom. berikutnya, dalam penelitian dan pengembangan kendaraan otonom, persaingan utamanya adalah apakah tersedia data yang lebih banyak dan lebih baik serta daya komputasi yang sesuai untuk melatih model tersebut. perolehan daya komputasi dan data bergantung pada berapa banyak uang yang dikeluarkan dan berapa banyak sumber daya yang diinvestasikan. beberapa hal ini tidak dapat dibeli dengan uang, seperti data pelatihan dan jarak tempuh pelatihan. setiap perusahaan mobil memiliki datanya sendiri dan tidak membaginya satu sama lain.

hal lain yang memerlukan investasi adalah daya komputasi.kekuatan komputasi kami saat ini sebesar 539 juta eflops diharapkan menjadi 800 juta eflops pada akhir tahun ini. ini bukan lagi 1 miliar yuan, tetapi biaya 2 miliar yuan, yang akan menghabiskan 2 miliar yuan per tahun. saat memasuki tahap l4 di masa depan, pertumbuhan data tahunan dan pertumbuhan daya komputasi akan bersifat eksponensial, yang berarti dibutuhkan setidaknya 1 miliar dolar as (enam hingga tujuh miliar yuan) setiap tahunnya. dan setelah 5 tahun, perlu terus melakukan iterasi. pada level ini, akan sangat sulit jika keuntungan dan keuntungan suatu perusahaan tidak dapat mendukung investasi. oleh karena itu, sekarang kita tidak perlu memperhatikan berapa miliar yang diinvestasikan dalam penggerak otonom. sebaliknya, kita mulai dari esensi dan melihat apakah terdapat cukup daya komputasi dan dukungan data, lalu melihat berapa banyak uang yang perlu diinvestasikan. .

pertanyaan: bagaimana cara memastikan keamanan model ketika jumlah data tidak terlalu besar? dari sudut pandang konseptual, apakah kita sekarang juga merupakan semacam "dua model"?

lang xianpeng:“keamanan” menjadi isu yang banyak menarik perhatian, apakah ada masalah koordinasi, apakah ada modul keamanan independen, dll. alasan mengapa setiap orang mengalami masalah ini adalah karena semua orang berpikir dari sudut pandang penelitian dan pengembangan kendaraan otonom non-ai di masa lalu. misalnya, saya biasa menunggang kuda. dia bertanya apakah ada pelana di mobil. itu karena semua orang belum benar-benar memahami apa itu praktik ai dan apa itu praktik non-ai. ini poin pertama.

kedua, banyak orang sekarang mengatakan bahwa mereka memiliki model end-to-end, namun model end-to-end yang sebenarnya masih bergantung pada dua kemampuan: apakah terdapat cukup data dan apakah terdapat cukup daya komputasi. jika tidak, menurut saya akan sulit untuk mencapai end-to-end yang sebenarnya, karena end-to-end adalah pendekatan ai.

ketiga, batas atas dan bawah kemampuan end-to-end sangat tinggi. izinkan saya membuat analogi. sebelum cnn (model jaringan saraf dalam) keluar, semua orang masih menggunakan metode pembelajaran mesin tradisional untuk melakukan beberapa pekerjaan, seperti tugas klasifikasi gambar yang kita kenal pada saat itu, algoritma svm mengalami kemacetan. tapi begitu cnn keluar, mereka kewalahan. apa yang ingin saya sampaikan adalah bahwa semua orang belum benar-benar memahami kemampuan end-to-end, dan kami tidak akan terburu-buru untuk memperkenalkannya kepada pengguna beta internal.

saat kami menggunakan metode non-ai, kami harus mempertimbangkan banyak skenario dalam hal detail kontrol vertikal. dengan cara ini, saat merancang aturan pemandangan, kami perlu menetapkan banyak kondisi untuk menetapkan tindakan apa yang perlu diambil dalam kondisi tertentu kondisi. strategi. namun ketika model end-to-end versi pertama kami dilatih, saya menemukan bahwa model ini akan sangat nyaman di setiap persimpangan atau dalam kondisi yang memerlukan kontrol longitudinal. kami tidak melakukan debug untuk situasi khusus, yang kami lakukan adalah kemampuan model untuk melatih dirinya sendiri. dapat ditemukan bahwa kita mempunyai masalah besar ketika membuat aturan karena skenarionya terlalu beragam dan tidak mungkin kita menetapkan aturan untuk semua skenario. namun saat kami menggunakan ai untuk membangun model end-to-end, kami akan menemukan bahwa ai memiliki kekuatan ajaib ini. saat kami memberikan data, ai dapat benar-benar mempelajari pengalaman berkendara orang-orang ini. tidak hanya dapat mempelajari batas atas , namun hal ini juga dapat meningkatkan model secara signifikan. meski masih memiliki keterbatasan, namun cara kita mengatasinya bukan lagi dengan menetapkan aturan, melainkan memberikan data yang lebih banyak dan lebih baik.

demikian pula, kami juga memiliki strategi yang mudah pada modul kontrol. karena input sensor end-to-end kami adalah input ke output lintasan, dan output lintasan diberikan ke modul kemudi dan pengereman. di sini kami memiliki kebijakan keselamatan. kami akan menerapkan batasan, namun hanya ada sedikit aturan serupa yang dapat diabaikan dibandingkan dengan pendekatan sebelumnya.

pada saat yang sama, kami telah meningkatkan keselamatan dan batas atas kemampuan. pendekatan kami adalah dengan terus menyediakan data berkualitas tinggi, dan pasti akan mempelajari banyak kebiasaan mengemudi yang aman.

pertanyaan: bagaimana cara memastikan bahwa data end-to-end + vlm bersih?

zhan kun:baik melakukan end-to-end atau vlm, data adalah yang paling penting, dan model besar selalu menekankan pada data berkualitas tinggi.jadi langkah pertama kita adalah membersihkan sumber data.pemilihan data berkendara kami sangat ketat. kami memiliki skor internal untuk setiap pemilik mobil, yang mencakup berbagai dimensi dan diberi bobot, seperti apakah ada pelanggaran mengemudi, apakah garis sudah lama ditekan, apakah berhenti. jalur telah diparkir, dan apakah proses mengemudinya 3% pengguna teratas akan dipilih sebagai "pengemudi berpengalaman" berdasarkan skor yang diberikan oleh berbagai indikator seperti saat memutar kemudi dalam keadaan sedang atau mendesak atau mengalami ketidaknyamanan. dalam kasus data ideal berskala besar, bahkan 3% pertama adalah jumlah data yang sangat besar. hal ini masih dapat memastikan bahwa data yang kami peroleh sangat baik. setidaknya perilaku mengemudi terstandarisasi, nyaman dan masuk akal jika data diberikan end-to-end.

ada juga penyaringan di tingkat kedua. selama proses pelatihan model, kita juga perlu mencocokkan dan mengklasifikasikan sampel model dalam beberapa skenario. ada banyak skenario yang ekstrim dan sulit, dan akan ada model evaluasi, metode evaluasi, dan beberapa aturan dapat membersihkan data dan mengklasifikasikan setiap jenis data dalam tag yang sangat detail.

pada lapisan terakhir, kita akan mengetahui sampel mana yang sulit dipelajari selama proses pelatihan dan menyesuaikan strategi pembelajaran, termasuk dengan sengaja mengkonstruksi beberapa data sintetik untuk pembelajaran penguatan dan pembelajaran kontrastif. lakukan beberapa penyesuaian pada metode pembelajaran data kita, sehingga seluruh data end-to-end dan data vlm kita akan terverifikasi dan dibersihkan dengan baik, dan model yang dihasilkan akan lebih baik. proses ini tidak terjadi dalam semalam.

lang xianpeng:ada lagi permasalahannya, yaitu masalah data kotor. volume data kami untuk pelatihan masih relatif besar. sekalipun nanti kami memiliki data kotor yang sangat kecil, karena pelatihan kemampuan ai tidak memiliki noda yang dapat mencemari keseluruhan efeknya, selama jumlah data akuratnya cukup besar, masih ada. akan ada sedikit gangguan. datanya juga tidak terlalu penting.

pertanyaan: dalam beberapa tahun terakhir, pertarungan teknologi dalam berkendara cerdas telah berubah dengan cepat dan melalui beberapa iterasi besar akankah + vlm end-to-end menjadi kerangka kerja yang memiliki vitalitas jangka panjang?

lang xianpeng:end-to-end + vlm adalah arsitektur yang mensimulasikan pemikiran dan kognisi manusia, karena ketika kita melakukan kecerdasan buatan, pada akhirnya kita berharap dapat mencapai antropomorfisme atau keserupaan dengan manusia. saya sangat terinspirasi setelah membaca buku "berpikir, cepat dan lambat", dan akhirnya ingin mengetahui bagaimana orang melakukan kognisi dan berpikir. kami pikir kerangka kecerdasan buatan saat ini sangat masuk akal, dan kami juga sangat senang melihatnya setelahnya kami mengusulkannya, banyak perusahaan di industri mulai menyebutkan manfaat teori sistem ganda dan mencoba menindaklanjutinya. selain itu, teori sistem ganda tidak hanya dapat digunakan dalam kendaraan otonom, tetapi juga merupakan paradigma kecerdasan buatan di masa depan dan bahkan robot cerdas. autonomous driving bisa dikatakan sebagai robot cerdas beroda, namun ruang lingkup kerjanya adalah jalan raya. oleh karena itu, saya pikir ia memiliki kemampuan jangka panjang tertentu, tetapi perkembangan teknologi tidak ada habisnya. kami akan menjaga kesadaran akan teknologi maju, dan jika ada teknologi baru, kami juga akan melacaknya.

pertanyaan: ideal saat ini merasa ada kesenjangan besar antara saya dan cara mengemudi cerdas tesla, dan kapan saya bisa mengejarnya?

lang xianpeng:tahun lalu saya jawab kurang dari setengah tahun, dan tahun ini mungkin kurang sedikit. pertama, dari segi arsitektur teknis, kami tidak jauh berbeda dengan tesla, bahkan sedikit lebih maju, karena kami memiliki vlm dan sistem 2, sedangkan tesla hanya memiliki sistem 1, end-to-end. kedua, dalam hal kekuatan komputasi pelatihan dan data pelatihan tiongkok, kami yakin bahwa setidaknya mulai saat ini, kami berada di depan tesla, karena tesla masih menghadapi beberapa kendala di tiongkok dalam hal kepatuhan data, serta pelatihan. kekuatan komputasi masih perlu dibangun di tiongkok. dari sudut pandang ini, kesenjangan antara kami di tiongkok dan tesla mungkin tidak terlalu besar. kami juga sangat berharap tesla dapat bergabung, belajar dari satu sama lain, dan fokus pada peningkatan diri.

pertanyaan: ada pandangan bahwa jalur ai untuk berkendara cerdas kurang tepat, dan menurut saya jalur ini tidak bisa berhasil, karena l2 lebih memperhatikan biaya rendah atau keserbagunaan, tetapi l4 hanya bisa mencapai universalitas setelahnya. keselamatan terpecahkan, jadi produksi massal bisakah mobilnya menjadi l4?

lang xianpeng:pertama,kami percaya bahwa segala sesuatu harus dimulai dari kebutuhan pengguna dan nilai pengguna.produk apa pun yang dibuat oleh li auto harus melebihi atau memenuhi nilai pengguna. kami percaya bahwa pengguna harus memiliki permintaan untuk mengemudi secara otonom, jadi tidak mungkin bagi kami untuk merancang bahwa pengguna hanya dapat mengendarai l4 di chengdu dan tidak di tempat lain.

kedua, jalur teknis progresif atau lompatan ke depan memungkinkan setiap merek berdiskusi dan memilih jalur teknisnya sendiri.namun li auto pasti akan memilih jalur teknis yang memenuhi kebutuhan pengguna.kami sekarang memilih untuk menggunakan kecerdasan buatan untuk melakukan mengemudi otonom. sebelumnya disebut assisted driving, sistem ini membantu orang mengemudi, dan subjeknya adalah manusia. namun setelah tahap end-to-end + vlm, kami yakin mobil akan melaju sendiri. setelah melatih model secara lengkap, model akan mampu mengemudikan mobil dengan baik. saya akan mengawasi dimana mobil tidak berfungsi atau jika ada petunjuk perlu diambil alih akan berfungsi sebagai peran tambahan dalam pengawasan. jika mencapai tingkat ini, itu akan memuaskan kami. permintaan pengguna akan mengemudi otonom adalah logika kami.

pertanyaan: apakah li auto berencana mengenakan biaya untuk berkendara cerdas kelas atas?

lang xianpeng:standar dan gratis adalah strategi yang dirumuskan ideal sejak hari pertama mengemudi cerdas. “mengemudi otonom dengan pengawasan” gratis untuk semua pemilik ad max. volume pengiriman relatif baik dan operasi perusahaan stabil. perusahaan juga memiliki sumber daya yang cukup untuk berinvestasi dalam penelitian dan pengembangan mengemudi cerdas. volume pengiriman adalah metrik yang sangat penting. bagi kami, ini bukan hanya tentang volume pengiriman, tetapi juga dapat memberikan lebih banyak mil pelatihan kendaraan untuk mengemudi secara otonom.

berita

dialog dengan ideal lang xianpeng: kita sudah berada di depan tesla

perkenalan

informasi kontak saya