berita

menghabiskan 1 miliar dolar setahun hanyalah sebuah permulaan. bisakah "praktik terbaik" menyeluruh yang bersifat "mitos" dalam lingkaran mengemudi otonom di tiongkok menghasilkan uang?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

penulis|hua wei

diperkirakan dalam waktu kurang dari setengah tahun,tesla fsd resmi akan masuk ke china. pada tanggal 5 september, tesla mengumumkan bahwa fsd akan diluncurkan di cina dan eropa pada kuartal pertama tahun 2025.

belum lama ini, tesla fsd v12 versi end-to-end mendapat banyak pujian dari industri dan luar industri setelah diluncurkan. bahkan mereka yang terang-terangan “bertengkar” dengan tesla berkali-kalixpeng motorketua he xiaopeng juga menulis bahwa mengemudi otonom tesla "berkinerja sangat baik" dan berkata dengan gembira bahwa "2025 akan menjadi momen chatgpt untuk mengemudi sepenuhnya otonom!"

model-model besar yang diwakili oleh gpt sangat memengaruhi model penelitian dan pengembangan program di bidang kendaraan otonom dengan kecepatan inovasi dan arsitektur teknisnya yang belum pernah terjadi sebelumnya, dan industri global dengan cepat merespons kegilaan ini. dilihat dari fokus perusahaan mobil dalam negeri saat ini, end-to-end juga telah menjadi jalur teknologi mengemudi otonom generasi berikutnya.

perusahaan pengemudi mobil penumpang otonom seperti huawei, xpeng, pony.ai, momenta, jiji technology, dan horizon secara aktif mengikuti langkah tersebut dan telah meluncurkan solusi dan model mengemudi otonom menyeluruh untuk produksi massal. dalam hal kendaraan komersial, zero one automobile juga mengumumkan rencana waktu yang jelas untuk peluncuran model besar end-to-end pada kendaraan tersebut.mobil idealpendiri dan ceo li xiang juga secara terbuka mengklaim bahwa li auto akan mencapai pengemudian otonom l4 dalam waktu tiga tahun dengan mengandalkan model end-to-end dan dunia.

bahkan pasar mobil otonom l4 yang sebelumnya sempat mengalami "gelombang dingin" kini telah pulih berkat hadirnya teknologi end-to-end. wayve, yang mengandalkan konsep teknis ini untuk memperoleh pendanaan sebesar us$1 miliar, adalah contoh yang bagus. liu yudong, manajer investasi chentao capital, berkata, “end-to-end membuka kurva pertumbuhan kedua untuk komersialisasi l4.”

tesla yang telah melakukan lompatan kemampuan fsd dengan kemampuan end-to-end juga mengumumkan akan meluncurkan model robotaxi pada 10 oktober. he xiaopeng juga secara terbuka mengungkapkan bahwa xpeng motors akan meluncurkan robotaxi pada tahun 2026. namun, tindakan dan ekspektasi baru-baru ini dari perusahaan mobil dan produsen mobil otonom untuk mencapai produksi massal l4 melalui solusi end-to-end telah menyebabkan banyak praktisi mengemudi otonom bertanya-tanya: apakah end-to-end terlalu "mitos"?

mengapa end-to-end menjadi "kelas atas" dalam lingkaran mengemudi yang cerdas?

end-to-end tidak hanya muncul dalam dua tahun terakhir, pada awal tahun 2017, banyak perusahaan menjajaki kemungkinan jalur teknis ini. tahun ini "end-to-end" menjadi populer di kalangan pengemudi otonom dan dianggap sebagai teknologi mematikan di industri. selain inovasi yang dibawa oleh model bahasa besar seperti chatgpt, teknologi ini juga tidak dapat dipisahkan dari teknologinya sendiri. pesona".

“kelahiran model end-to-end adalah satu-satunya cara teknologi penggerak otonom mengarah pada komersialisasi skala besar.” lou tiancheng, salah satu pendiri dan chief technology officer pony.ai, mengatakan bahwa salah satu keuntungan terbesarnya salah satu keunggulan model end-to-end adalah kemampuan generalisasi dapat meningkatkan kecepatan komersialisasi kendaraan otonom dan mempercepat mempopulerkan kendaraan otonom.

menurut wang panqu, kepala mengemudi cerdas di zero one automobile, sistem mengemudi otonom non-end-to-end tradisional tidak hanya memiliki generalisasi yang lebih buruk daripada end-to-end, tetapi juga ketika memperluas ke skenario baru, banyak yang sebelumnya menggunakan aturan- solusi berbasis akan jika gagal, kode yang baru ditambahkan akan memperburuk pemeliharaan sistem, yang akan menyebabkan peningkatan biaya marjinal.

selain itu, sistem penggerak otonom tradisional juga memiliki dua kelemahan. yang pertama adalah kompleksitas arsitektur. tidak hanya biaya pengembangan sistem multi-modul yang lebih tinggi, karena setiap modul dialokasikan sumber daya komputasi yang lebih sedikit, batas atas kinerjanya juga relatif rendah, dan komunikasi antar modul juga akan menghasilkan banyak modul. masalah rekayasa. masalah optimasi. yang kedua adalah masalah biaya tinggi yang disebabkan oleh arsitektur yang kompleks. setiap modul memerlukan pengembangan, pemeliharaan, manajemen proyek, dan integrasi.

“menurut saya, end-to-end dapat menyelesaikan masalah ini dengan sangat baik.” wang panqu mengatakan bahwa dari sudut pandang arsitektur, end-to-end hanya memiliki satu modul, yang dapat menyelesaikan masalah arsitektur yang kompleks dengan baik dan juga memiliki modul. kemampuan untuk mengurangi biaya dan meningkatkan efisiensi. generalisasi ujung ke ujung yang didorong oleh data dan bahkan pengetahuan sangat kuat dan kemungkinan besar akan segera diimplementasikan ke dalam produksi massal. hal ini tidak hanya dapat mengurangi biaya adaptasi l2 ke berbagai model, tetapi juga membantu l4 mengurangi waktu adaptasi ke skenario yang berbeda.

selain itu, lou tiancheng menunjukkan bahwa manfaat terbesar dari end-to-end adalah mencegah hilangnya informasi antara modul dan fungsi yang berbeda. mao jiming, wakil presiden teknik di jiji technology, juga berbicara tentang aspek ini dan menjelaskan bahwa transmisi informasi yang efektif antar modul melibatkan masalah transmisi informasi yang efektif. antarmuka modul hulu dan hilir menentukan batas atas transmisi informasi. namun secanggih apa pun desain antarmukanya, informasi akan hilang. solusi modul terpadu end-to-end tidak mengalami kehilangan informasi ini, yang membantu meningkatkan efek algoritma akhir.

pada saat yang sama, mao jiming juga berbicara tentang keuntungan lain dari arsitektur end-to-end. pertama, dalam hal kesalahan modul, karena end-to-end berada di bawah satu modul, tidak ada efek amplifikasi kesalahan dari beberapa modul, dan batas atas kemampuan algoritma penggerak cerdas secara keseluruhan dapat dimaksimalkan. kedua, dalam arsitektur multi-modul, setiap modul memiliki ritme r&d dan tujuan pengoptimalannya sendiri, yang tidak selalu dapat diselaraskan secara ketat dengan tujuan pengoptimalan global dari seluruh sistem penggerak cerdas, sehingga berpotensi menghasilkan pengoptimalan yang tidak efektif dan investasi sumber daya r&d yang terbuang sia-sia; sedangkan terminal arsitektur ujung ke ujung hanya memiliki satu modul, dan tujuan pengoptimalannya jelas dan terpadu, yang secara efektif dapat menghindari proses pengoptimalan gesekan internal ini.

hal lainnya adalah bahwa komponen arsitektur modular secara alami dengan mudah membentuk beberapa "domain" yang digerakkan oleh aturan, yang membawa serangkaian tantangan pemeliharaan dan dilema penyelesaian kasus sudut dan ujung ke ujung, sebagai arsitektur yang sepenuhnya berbasis data; akan mendorong pengembang lebih proaktif dan mulai mempertimbangkan dan memecahkan masalah dari paradigma pemikiran berbasis data dan berbasis model, sehingga meningkatkan tingkat kognitif seluruh tim algoritme.

“secara keseluruhan, efisiensi pengembangan sistem end-to-end lebih tinggi dan konsumsi sumber daya lebih sedikit.” liu yudong mengatakan bahwa paradigma pembangunan end-to-end yang murni berbasis data akan mengurangi banyak investasi awal dalam skala besar merekayasa sumber daya dan mengalihkan fokus sumber daya perusahaan peralihan ke kepadatan talenta yang tinggi dalam aspek berbasis data dan investasi dalam akumulasi data.

perlu disebutkan bahwa nilai pengguna yang dibawa secara end-to-end juga telah menarik banyak perhatian. liu yudong menunjukkan bahwa, pertama, dalam hal pemrosesan skenario jangka panjang, sistem end-to-end dapat mencakup skenario yang lebih ekstrem daripada sistem asli, seperti kemampuan pemrosesan yang masuk akal. kedua, perilaku sistem mengemudi otonom lebih antropomorfik, dan juga dapat membangun kepercayaan yang lebih kuat antara konsumen dan sistem, lebih seperti pengemudi manusia dalam skenario dengan permainan yang kuat.

batas atas sudah tinggi dan batas bawah sudah rendah. apakah “akhir” dari mengemudi otonom sudah berakhir?

meskipun keunggulan teknis end-to-end sangat signifikan, dan banyak perusahaan mobil serta perusahaan pengemudian otonom secara aktif menindaklanjuti penerapan end-to-end, masih terdapat perbedaan pendapat di industri mengenai apa yang disebut "model end-game". ."

pendukung seperti wang panqu mengatakan, "saya percaya bahwa end-to-end harus menjadi bentuk akhir dari mewujudkan mengemudi otonom, namun end-to-end hanyalah sebuah kerangka teknis, namun sebenarnya ada banyak pilihan untuk metode implementasi yang spesifik, dan industri ini belum mencapai konsensus."

rasionalis seperti mao jiming mengemukakan bahwa solusi end-to-end memiliki karakteristik "batas atas yang tinggi tetapi batas bawah yang rendah". dalam istilah awam, jika dilakukan dengan baik, hasil yang baik dapat dicapai, namun jika dilakukan dengan buruk, hasilnya akan lebih buruk dibandingkan solusi tradisional. dalam pandangan mao jiming, pemilihan solusi end-to-end bergantung pada skenario aplikasi spesifik. untuk mengemudi otonom l5, end-to-end adalah satu-satunya solusi; namun untuk l2 dan l3, end-to-end hanyalah salah satu solusi yang layak. selain itu, penerapan end-to-end perlu dikombinasikan dengan solusi teknis lainnya.

lou tiancheng juga memiliki pandangan serupa, percaya bahwa l2 dan l4 mengemudi otonom sudah direalisasikan, namun kualitas penerapan dan cakupan penerapannya memiliki persyaratan dan standar teknologi yang berbeda.

untuk mengemudi otonom tingkat l2, teknologi end-to-end saat ini merupakan jalur yang lebih baik; untuk mengemudi otonom tingkat l4, teknologi end-to-end dapat membantunya dengan cepat membuka area baru. namun, l4 memiliki persyaratan keselamatan yang lebih tinggi, yaitu harus lebih dari 10 kali lipat dari pengemudi manusia. oleh karena itu, selain menggunakan end-to-end, juga perlu memasukkan instruksi determinisme tinggi berdasarkan niat mengemudi dan skenario penerapan. seperti peraturan lalu lintas, preferensi mengemudi, dll.

liu yudong memberikan kesimpulan yang lebih hati-hati: "saat ini, end-to-end adalah akhir dari mengemudi otonom di masa depan, namun ada berbagai kemungkinan untuk evolusi teknologi jangka panjang. sama seperti yang kami lakukan tiga tahun lalu. tanpa diduga, a teknologi seperti chatgpt akan muncul, dan arsitektur teknis baru mungkin muncul dalam dua atau tiga tahun untuk menumbangkan chatgpt saat ini.”

100% end-to-end belum muncul, apa itu "best practice"?

meskipun belum jelas apakah solusi end-to-end merupakan solusi akhir untuk mengemudi otonom, penerapan praktisnya jelas telah menjadi solusi konsensus dalam industri mengemudi cerdas. namun, masih banyak kontroversi di industri mengenai pilihan jalur teknologi penggerak otonom end-to-end.

saat ini, zero one automotive bergerak maju di sepanjang rute end-to-end berdasarkan model bahasa multimoda besar. hal ini tidak hanya mencapai hasil pada beberapa kumpulan data publik, tetapi juga dalam mengemudi otonom yang diselenggarakan oleh shanghai artificial intelligence laboratory bekerja sama dengan cvpr dan lainnya tahun ini. dalam tantangan internasional, dengan solusi mengemudi otonom visual murni, perusahaan ini meraih posisi kedua di antara 143 tim internasional di jalur mengemudi otonom menyeluruh.

wang panqu percaya bahwa modular end-to-end setara dengan tahap eksplorasi awal dan dapat diimplementasikan lebih cepat. saat ini, akademisi dan industri juga memiliki solusi yang relatif matang. penerapan rute teknis end-to-end berdasarkan model multimoda besar berpotensi mengubah mengemudi otonom menjadi bisnis yang menguntungkan, dan hanya model dasar dengan generalisasi yang kuat yang dapat memberikan suntikan pengetahuan dan integrasi yang diperlukan di bidang tersebut. mengemudi otonom.

sederhananya, generalisasi yang kuat pada model-model besar akan membawa keunggulan kinerja pada seluruh sistem end-to-end, dan juga akan memungkinkan tercapainya penggerak otonom kelas atas yang menguntungkan dalam produksi massal skala besar di masa depan. selain itu, di masa depan, kedua rute teknis end-to-end berdasarkan model besar multimodal dan model dunia dapat digunakan kembali satu sama lain.

liu yudong mengatakan bahwa pada prinsipnya, satu model lebih mirip dengan bentuk agi di bidang lain, sedangkan model dunia saat ini terutama merupakan alat untuk menghasilkan data, dan akan membutuhkan waktu lebih lama untuk melihat apakah model tersebut dapat digunakan sebagai sistem penggerak otonom. . dalam dua tahun ke depan, ada dua tipe utama solusi end-to-end: satu adalah modular end-to-end, perwakilan umumnya adalah uniad dari shanghai artificial intelligence laboratory; yang lainnya adalah solusi berbasis model besar multi-modal .

mengenai model dunia, mao jiming mempunyai pandangan berbeda. ia percaya bahwa model dunia adalah solusi menyeluruh yang masuk akal. berdasarkan model dunia, algoritme mengemudi cerdas memiliki kemampuan untuk memahami pemandangan dan membuat prediksi yang masuk akal tentang masa depan, serta mengambil keputusan berdasarkan informasi tersebut. ini adalah solusi yang lebih sejalan dengan logika pemikiran manusia.

zhu zheng, salah satu pendiri dan kepala ilmuwan jiji technology, lebih lanjut menambahkan bahwa pelatihan satu model sangat memakan sumber daya dan waktu, serta memiliki persyaratan yang sangat tinggi untuk skala dan kualitas data. metode end-to-end menggunakan kemampuan prediksi model untuk membuat persepsi pemandangan dan keputusan perilaku mengemudi, yang lebih konsisten dengan perilaku dan kebiasaan mengemudi manusia. menurut perkenalannya, jiji saat ini memiliki sistem prototipe dasar end-to-end berdasarkan model dunia, dan sedang memverifikasinya bersama dengan produsen mobil, dan beberapa kemajuan akan segera diumumkan ke publik.

pada bulan agustus tahun lalu, pony.ai menyatukan tiga modul tradisional persepsi, prediksi, dan kontrol ke dalam satu model model mengemudi otonom ujung ke ujung. kini modul tersebut telah dipasang secara bersamaan di taksi otonom l4 dan mobil penumpang berbantuan l2. . menurut lou tiancheng, baik model modular end-to-end maupun satu model saat ini masih dalam tahap awal dan belum diverifikasi untuk produksi dan pengiriman massal. diharapkan dalam 1 hingga 2 tahun ke depan, jalur teknis menyeluruh akan beralih dari ketidaksepakatan ke konsensus.

“dalam jangka panjang, end-to-end end-to-end pada akhirnya akan berbentuk satu model.” mao jiming mengatakan bahwa dengan status saat ini, end-to-end “dua tahap” diadopsi oleh huawei , xiaopeng dan perusahaan lain masih merupakan implementasi semi-end-to-end, atau dalam keadaan transisi ujung-ke-ujung daripada keadaan lengkap.

belum lama ini,ekstrimceo otomotif xia yiping juga secara terbuka mengatakan, "tidak ada seorang pun di pasar yang benar-benar end-to-end, semuanya hanyalah gimmick pemasaran." dapat dipahami bahwa solusi mengemudi cerdas end-to-end jiyue saat ini juga menggunakan "dua tahap “arsitektur teknis.

atribut "kotak hitam" adalah kesalahpahaman dan dapat dibuat mirip dengan kotak abu-abu atau kotak putih

serangkaian keuntungan dari solusi end-to-end berasal dari arsitekturnya yang mengintegrasikan beberapa modul, namun desain ini juga membuat sistem lebih dekat dengan "kotak hitam" daripada "kotak putih" yang dapat dimengerti, sehingga memiliki lebih banyak "tidak dapat dijelaskan ".

lou tiancheng percaya bahwa ketidakjelasan adalah kelemahan alami dari sistem end-to-end, tetapi apakah hal itu akan membatasi pengembangan teknologi mengemudi otonom end-to-end bergantung pada situasinya. untuk l2, uninterpretability tidak mempengaruhi aplikasi end-to-end. misalnya, modular end-to-end masih mempertahankan setiap modul fungsional utama, dan fitur keluaran perantara dapat diekstraksi lebih lanjut menjadi data yang dapat diinterpretasikan.

untuk l4, persyaratan keamanan dan kepastiannya jauh lebih tinggi dibandingkan l2. oleh karena itu, perlu untuk memasukkan instruksi rutin ke dalam model, seperti peraturan lalu lintas, preferensi mengemudi, dll., untuk membantu model mengemudi otonom end-to-end lebih memahami niat mengemudi. pada saat yang sama, kemampuan model juga perlu ditingkatkan untuk mendorong keluaran niat ke dunia luar guna lebih meningkatkan kemampuan interpretasi.

dalam pandangan zhu zheng, meskipun end-to-end memang merupakan kotak hitam dari tingkat produk dan bentuk akhir r&d, dari sudut pandang insinyur dan perancang produk, termasuk pengguna, end-to-end dapat dibuat mirip dengan kotak abu-abu. kotak atau kotak putih.

pertama, gabungan modular end-to-end membedakan tiga modul persepsi, prediksi dan perencanaan secara rinci. setiap hasil perencanaan dapat dikaitkan dengan modul perantara sebelumnya. kedua, satu model dapat mengeluarkan hasil antara yang termodulasi. menandai hasil untuk pengawasan perantara dapat membuat satu model menyatu dengan lebih baik, dan hasil antara yang dimodelkan juga dapat diperlihatkan kepada para insinyur atau pengguna. ketiga, hal terpenting tentang model dunia adalah kemampuan prediksinya, dan hasil prediksinya juga dapat dikaitkan dengan hasil antara yang terpola.

mao jiming mengatakan bahwa pernyataan "kotak hitam" end-to-end saat ini adalah kesalahpahaman tentang rincian inferensi pelatihan dari keseluruhan model. selama kognisi penelitian dan pengembangan disajikan dalam bentuk yang dapat dijelaskan secara eksternal, maka hal tersebut bukan lagi kotak hitam.

wang panqu juga berpendapat bahwa usulan tidak dapat dijelaskan mencerminkan kepercayaan masyarakat terhadap teknologi, yaitu apakah kinerja teknologi itu sendiri mencapai standar yang dapat diterima semua orang. dengan berkembangnya teknologi berbasis data, desain algoritme, keamanan model besar, dan teknologi terkait lainnya, akan terjadi lompatan besar dalam performa dan keandalan end-to-end dalam satu hingga dua tahun ke depan. melalui pengujian kinerja skala besar dan verifikasi penuh, interpretasinya tidak lagi menjadi masalah penting.

"puncak" orientasi end-to-end akan datang, dan kendaraan komersial akan diluncurkan lebih cepat

"peluncuran modular end-to-end dalam skala besar dilakukan dalam satu tahun terakhir, dan end-to-end berdasarkan model bahasa besar akan membutuhkan waktu tambahan 1 hingga 2 tahun." wang panqu menunjukkan bahwa l4 bersifat komersial kendaraan harus lebih cepat daripada penerapan mobil penumpang. alasannya adalah sistem penggerak otonom kelas atas yang dapat diproduksi secara massal dalam jumlah besar sangat sulit untuk diterapkan dalam skenario kendaraan komersial lebih sederhana daripada mobil penumpang, dan satu skenario mudah untuk menutup loop secara komersial, dan juga mudah untuk melakukan asimtotik adegan.

liu yudong lebih optimis, percaya bahwa tahun depan modular end-to-end dan satu model end-to-end akan mulai didorong lebih intensif. selain itu, liu yudong mengatakan dari perspektif tingkat radikal perkembangan teknologi dan pengumpulan bakat, kecepatan iterasi teknologi dan kesulitan penerapan teknologi, waktu implementasi aktual kendaraan komersial dan kendaraan penumpang end-to-end mungkin serupa. , namun cakupan penerapan kendaraan penumpang akan lebih besar dibandingkan kendaraan niaga, dan kendaraan niaga perlahan akan berkembang pada tahap selanjutnya.

“rintangan ini harus diatasi sebelum produksi massal end-to-end. yang pertama adalah persiapan daya komputasi kendaraan, yang kedua adalah iterasi algoritma end-to-end, yang ketiga adalah skala data cloud, dan yang ketiga adalah skala data cloud. yang keempat adalah skala daya komputasi, dan yang ketiga adalah iterasi algoritma end-to-end. yang kelima adalah rencana verifikasi,” kata mao jiming.

dalam pandangannya, tesla dan oem serta perusahaan terkemuka dalam negeri seperti wei xiaoli dan huawei telah dilengkapi dengan ketiga aspek yaitu daya komputasi kendaraan, skala data cloud, dan skala daya komputasi cloud. dari akhir tahun ini hingga paruh pertama tahun depan, algoritma end-to-end dari beberapa perusahaan mobil terkemuka akan dapat diluncurkan dalam skala besar; mulai paruh kedua tahun depan, industri akan mengantarkan dalam ledakan produksi dan peluncuran massal end-to-end.

secara end-to-end, apakah ini berarti “memulai dari awal”?

pengembangan dan penerapan sistem end-to-end tidak diragukan lagi akan membawa revolusi teknologi pada solusi berkendara cerdas secara keseluruhan. jadi, apakah kita perlu menggulingkan teknologi sebelumnya untuk memasuki pasar end-to-end?

liu yudong percaya bahwa teknologi penggerak otonom asli tidak akan sepenuhnya ditumbangkan, dan akan berbagi algoritma dan akumulasi perangkat lunak tertentu secara end-to-end.

yang pertama adalah bagian persepsi. banyak bagian pemrosesan informasi kamera front-end end-to-end sekarang menggunakan metode bev, seperti backbone atau encoder. yang kedua adalah bagian regulasi dan pengendalian. beberapa pengetahuan asli dalam regulasi dan pengendalian dapat dipindahkan ke sistem end-to-end. yang ketiga adalah infrastruktur data. ini merupakan kemampuan penting yang dibutuhkan perusahaan untuk operasi end-to-end di masa depan. perusahaan yang dapat menerapkan solusi bev juga memiliki infrastruktur data yang relatif kuat.

dalam pandangan mao jiming, apakah akan dibatalkan tergantung pada solusi teknis sebelumnya. dia mengatakan bahwa inti end-to-end adalah model besar multi-moda murni berbasis data. jika solusi teknis sebelumnya dari perusahaan pengemudi cerdas tertentu memiliki banyak aturan, maka aturan ini pada dasarnya akan dibatalkan jika solusi teknis sebelumnya sudah ada sebagian besar telah diubah menjadi berdasarkan model, jadi kemungkinan besar bagian kode ini dapat digunakan kembali dalam beberapa bentuk.

perlu ditekankan bahwa perubahan model r&d yang disebabkan oleh algoritma end-to-end adalah fokus dari setiap oem dan perusahaan penggerak otonom, dan ini juga merupakan tempat yang paling menyakitkan.

wang panqu juga mengatakan bahwa selain model akhir, lebih banyak pekerjaan data yang perlu dilakukan secara end-to-end: pertama, sistem loop tertutup data dan efisiensi iterasinya perlu direkonstruksi, dan kedua, end-to-end. pengujian dan verifikasi, sensor dari seluruh platform simulasi. masukannya harus sangat realistis, yang merupakan masalah teknis yang sangat menantang saat ini. namun, dalam hal biaya tenaga kerja, biaya keseluruhan sistem penggerak cerdas end-to-end lebih rendah dibandingkan non-end-to-end, karena hanya ada beberapa modul dalam sistem end-to-end, dan tim inti yang terdiri dari 20-30 insinyur sudah cukup.

selain itu, mao jiming menunjukkan bahwa dari arsitektur modular tradisional ke model ujung ke ujung, struktur biaya solusi mengemudi cerdas juga akan berubah: biaya tenaga kerja dari sejumlah besar pakar penelitian dan pengembangan yang menulis berbagai peraturan akan bermigrasi ke aspek datanya. hal ini merupakan hal yang baik bagi oem dengan kemampuan produksi massal. karena biaya perolehan data yang lebih rendah, keseluruhan biaya solusi mengemudi cerdas akan semakin berkurang secara signifikan.

dalam hal investasi daya komputasi, lou tiancheng mengatakan dalam jangka pendek, pembelian chip daya komputasi berukuran besar memang akan meningkatkan biaya saat ini. namun dalam jangka panjang, setelah teknologi end-to-end matang dan diterapkan, biaya investasi awal secara bertahap akan berkurang.

investasi daya komputasi end-to-end murni lebih kecil dibandingkan arsitektur modular, yaitu setidaknya 100 hingga 200 juta per tahun.

“jika anda ingin model end-to-end mencapai tingkat pelatihan yang relatif baik, anda memerlukan setidaknya 100 juta hingga 200 juta investasi daya komputasi per tahun, dan jumlah jalur mobil penumpang pasti akan lebih mengesankan. ."

menurut wang panqu, daya komputasi yang dibutuhkan secara end-to-end dibagi menjadi dua aspek: pelatihan dan penerapan. penerapannya setara dengan jumlah pengontrol domain yang perlu dibeli. biaya ini tetap dan relatif rendah, terkait dengan biaya satu kendaraan. biaya terbesar adalah biaya pelatihan, yang dapat dibagi menjadi dua jenis: kartu yang dibuat sendiri dan dibeli atau kerjasama dengan penyedia layanan cloud. bagi perusahaan mobil dengan pesanan yang relatif besar, membangun pusat data sendiri merupakan pilihan yang hemat biaya; namun bagi produsen mobil dengan pesanan dalam jumlah yang lebih sedikit atau dalam tahap awal penelitian dan pengembangan, menyewa server dari penyedia layanan cloud adalah pilihan yang lebih baik.

sebelumnya, lang xianpeng, wakil presiden intelligent driving li auto, secara terbuka mengungkapkan bahwa li auto saat ini menghabiskan 1 miliar yuan untuk pelatihan daya komputasi setiap tahun, dan diperkirakan akan menghabiskan 1 miliar dolar as setiap tahun di masa depan. “jika kita tidak dapat menghabiskan 1 miliar dolar as per tahun untuk pelatihan, kita mungkin tersingkir dalam kompetisi mengemudi otonom di masa depan.”

dalam hal skala daya komputasi, lou tiancheng percaya bahwa jika ini hanya pelatihan model mengemudi otonom end-to-end yang sederhana, ratusan gpu dengan daya komputasi besar dapat mendukungnya. jika investasi jangka panjang diperlukan dan kualitas menyeluruh terjamin, skala daya komputasi pelatihan setiap perusahaan pengemudi otonom pada dasarnya berada pada tingkat ribuan kalori, dan perusahaan mobil akan berinvestasi lebih banyak.

mao jiming memberikan persyaratan daya komputasi end-to-end yang lebih spesifik: seluruh sistem memerlukan setidaknya dua nvidia orin atau satu nvidia thor. dia mengatakan bahwa kebutuhan daya komputasi dari sistem end-to-end murni lebih kecil dari total kebutuhan daya komputasi arsitektur modular. namun, selain sistem utama, produksi massal end-to-end sering kali memiliki sistem bypass , dan kebutuhan daya komputasinya secara umum sama dengan arsitektur modular sebelumnya.

namun, wang panqu percaya bahwa dengan peningkatan kemampuan chip komputasi sisi kendaraan, daya komputasi tidak akan menjadi hambatan bagi proses end-to-end onboarding di masa depan. lou tiancheng menganut pandangan yang sama, mengatakan bahwa dari arsitektur klasik hingga end-to-end, jumlah total kode akan berkurang secara signifikan, dan konsumsi sumber daya komputasi yang dibawa oleh jaringan saraf end-to-end belum tentu signifikan. ditingkatkan dibandingkan dengan model bev.

“keinginan untuk daya komputasi yang lebih tinggi lebih berasal dari peningkatan parameter model dan kinerja model, dibandingkan dari transformasi end-to-end.” selain itu, ia menunjukkan bahwa dari perspektif aplikasi pendaratan end-to-end, perusahaan terkait harus lebih memikirkan hal yang paling penting adalah bagaimana memanfaatkan sepenuhnya sumber daya komputasi chip yang ada untuk meningkatkan efisiensi pemanfaatan.