berita

Wei Xiaoli ujung ke ujung: bentuknya berbeda, tetapi suka dan duka saling terkait

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Di Internet Tiongkok, Musk sering diejek sebagai "Dewa Asli" untuk diejek "TeslaTanpa open source, Tiongkok tidak akan mampu membangun mobil listrik murni,” kata pihak yang membenci negara tersebut.

Namun, di bidang berkendara cerdas, Tesla memang telah lama memainkan mercusuar yang memimpin prospek industri dengan mengadakan AI Day untuk berbagi detail teknis (catatan: mungkin ada lebih dari satu mercusuar).

Namun mulai tahun lalu, Tesla membatalkan Hari AI dan hanya mengumumkan kemajuan teknologi dan tidak lagi berbicara tentang penerapan teknologi. Yang tersisa bagi dunia luar adalah kabar baik yang sering muncul tentang FSD yang menggunakan solusi teknis ujung ke ujung. Tahun ini, berbagai perusahaan smart Driving membuka latihan end-to-end yang diberikan Tesla, dan tiba-tiba menemukan sederet kata kecil di kolom jawaban: Selesaikan masalahProsesnya dihilangkan.

Bagaimana cara melakukan end-to-end tanpa referensi jawaban? Apakah penelitian dan pengembangan berkendara cerdas menyeluruh didukung oleh model bisnis yang masuk akal?

Pertanyaan ini pertama kali diajukan kepada Wei Xiaoli, perwakilan dari kekuatan pembuat mobil baru.


01 

Buka kotak hitam



Dari tahun lalu hingga paruh pertama tahun ini, tema utama kompetisi antar pemain smart Driving dalam negeri adalah bersaing memperebutkan kecepatan pembukaan kota dengan taktik lautan manusia di bawah arsitektur teknologi modular tradisional.

Selama proses ini, tim pengemudi cerdas Wei Xiaoli berkembang menjadi seribu orang (atau lebih), melatih, menguji, dan memverifikasi siang dan malam untuk menaklukkan Kasus Sudut.

Tesla FSD telah memverifikasi efek end-to-end, memberikan setiap orang kesempatan untuk membebaskan diri dari duplikasi pekerjaan.Namun harga yang harus dibayar adalah setiap modul dari tumpukan teknologi mengemudi pintar tradisional dapat diuji dan diverifikasi, sedangkan sistem mengemudi cerdas ujung ke ujung adalah kotak hitam yang hanya mengetahui hasil tetapi tidak mengetahui prosesnya.Wei Xiaoli bergerak menuju end-to-end, dan masalah umum yang mereka hadapi adalah:

Dalam fungsi dengan persyaratan keselamatan yang kuat seperti mengemudi cerdas, kotak hitam lengkap tidak dapat diterima. Penting untuk menemukan cara untuk membuka kotak hitam ini dan memahami "mengapa sistem ingin melakukan ini", atau setidaknya membuat keluarannya relatif. dapat dikontrol.

XiaopengPilihannya adalah rute progresif ujung ke ujung yang tersegmentasi, dan solusi teknisnya adalah jaringan saraf perseptual XNet + jaringan saraf perencanaan XPlanner + model bahasa visual XBrain yang berfokus pada pemahaman adegan.

Xpeng tersegmentasi dari ujung ke ujung


Dalam rantai teknologi end-to-end, segmentasi end-to-end saat ini berada pada hilir.

Kaum radikal percaya bahwa segmentasi end-to-end masih tidak melepaskan diri dari cakupan solusi tradisional. Meskipun persepsi dan perencanaan telah menerapkan jaringan saraf, satu poin penting tidak berubah—antarmuka yang menghubungkan kedua jaringan saraf masih bersifat manusiawi. antarmuka yang ditentukan. Ini berarti hilangnya informasi dan sejumlah besar anotasi manual. Seluruh proses tidak kondusif untuk pengoptimalan dan otomatisasi global.

Namun keuntungan dari segmentasi end-to-end juga ada di sini: terdapat antarmuka yang ditentukan manusia, yang berarti bahwa hasil antara yang dapat dipahami manusia akan dikeluarkan, yang memudahkan untuk memeriksa dan menemukan masalah, dan tidak akan mempengaruhi seluruh tubuh. , seperti masalah penginderaan. Tidak perlu melatih ulang seluruh jaringan. Melatih dua model yang lebih kecil secara bersamaan tidak terlalu sulit dan menghabiskan lebih sedikit sumber daya komputasi dibandingkan melatih satu model end-to-end yang besar.

Lebih penting lagi, metode ini secara teoritis lebih mudah untuk mempertahankan batas bawah performa berkendara cerdas.

Pada tanggal 30 Juli, setelah peluncuran mobil cerdas XNGP Xpeng, yang dibuka sepenuhnya secara nasional, He Xiaopeng berkata, “Bangunan perlu dibangun lapis demi lapis tinggi."

Kalimat ini diartikan sebagai teguran kepada pengusaha yang ramah.

Pada awal Juli, Lili memperkenalkan solusi satu tahap end-to-end yang sedang dikembangkan pada konferensi musim panasnya: 4D One Model end-to-end. Dalam satu tahap end-to-end, persepsi dan perencanaan dikemas ke dalam jaringan saraf dengan ratusan juta parameter, dan video mengemudi dari pengemudi berpengalaman menjadi data pelatihan yang paling penting. Solusi ini mendukung transmisi informasi lossless dan memiliki tingkat otomatisasi aliran data yang lebih tinggi. Solusi ini lebih radikal dibandingkan solusi end-to-end dari Xiaopeng dan Huawei.

Namun, solusi end-to-end ini memiliki masalah seperti generalisasi yang lemah, interpretasi yang buruk, dan batas bawah yang tidak stabil. Oleh karena itu, Ideal telah menghubungkan VLM (Vision-Language Model) dengan skala 2,2 miliar parameter ke end-to-end. model ujung ke ujung. Model ini memiliki pemahaman yang lebih kuat tentang pemandangan lalu lintas yang kompleks dan rambu teks lalu lintas, serta dapat memberikan referensi untuk keputusan berkendara dalam model end-to-end, sehingga meningkatkan kinerja sistem mengemudi cerdas.

idealujung ke ujung+VLMSolusi mengemudi cerdas sistem cepat dan lambat

Pada bulan Agustus, solusi mengemudi cerdas sistem ganda yang cepat dan lambat dari Ideal yang end-to-end + VLM memulai pengujian internal terhadap ribuan orang untuk pengguna profesional .

Sebelumnya, Ideal tidak memimpin dalam persepsi pengguna terhadap Zhijia, yang berdampak negatif pada penjualan (terutama terhadapTanyakan pada duniajam). End-to-end + VLM idealnya didefinisikan sebagai pertarungan kunci untuk kemampuan mengemudi yang cerdas untuk menyalip di tikungan dan menjadi eselon satu.

Sebaliknya,TIDAKIa mengadopsi sikap konservatif dan radikal terhadap end-to-end.

NIO bersifat konservatif karena penggunaan end-to-end saat ini sangat terbatas dan tidak digunakan untuk NoA perkotaan, hanya untuk fungsi keselamatan aktif. Pada tanggal 11 Juli, NIO mulai mendorong AEB menggunakan solusi end-to-end untuk memecahkan masalah kurangnya cakupan skenario AEB dalam solusi tradisional.

Sisi radikal dari NIO adalah bahwa mengemudi cerdas yang akan diluncurkan akhir tahun ini tampaknya siap untuk melewati tren orientasi end-to-end yang populer saat ini dan langsung menuju ke tahap berikutnya: orientasi model dunia.

Model dunia adalah metodologi terbaru yang ditemukan dalam industri mengemudi cerdas. Di CVPR, konferensi kecerdasan buatan tertinggi pada tahun 2023, Tesla mendemonstrasikan hasil penelitian dan pengembangan model dunia. Wayve.ai, sebuah perusahaan rintisan yang terkenal di industri dengan model dunia mengemudi otonom GAIA-1, mengumpulkan dana sebesar US$1 miliar pada tahun 2023. Mei tahun ini.

Dengan mempelajari sejumlah besar video adegan mengemudi nyata, model dunia dapat memprediksi dan menghasilkan video adegan mengemudi dalam waktu tertentu di masa depan untuk membuat keputusan mengemudi yang tepat. Esensinya adalah pengurangan ruang-waktu. Hal ini mirip dengan perilaku mengemudi manusia. Pengemudi berpengalaman akan memprediksi dan menyimpulkan perilaku peserta lalu lintas lain dan perubahan arus lalu lintas dalam pikiran mereka, dan merencanakan operasi mengemudi berdasarkan ini.

Apa yang lebih jauh dari model dunia end-to-end saat ini adalah bahwa tugas utamanya tidak hanya memberikan jalur yang direncanakan, namun juga untuk "memprediksi perubahan piksel dalam adegan mengemudi." Tugas yang sangat sulit ini akan memaksa model tidak hanya mempelajari perilaku pengemudi yang baik, tetapi juga mempelajari pengetahuan lalu lintas dan fisika yang luas.

Apa yang diusulkan Weilai di NIO IN adalah "model dunia PLUS" yang lebih sulit, lebih kompleks dan memiliki lebih banyak dimensi keluaran, yang berarti lebih banyak sinyal pengawasan dapat dibentuk dengan membandingkannya dengan nilai sebenarnya, dan mempercepat pelatihan saraf jaringan, dan juga mengurangi tingkat kotak hitam operasi sistem. Namun harganya adalah kesulitan pengembangan yang lebih tinggi.

model dunia NIO,Ada banyak sekaliKeluaran tugas prediksi dari


Sebagai referensi, untuk melatih model dunia GAIA-1, yang hanya digunakan untuk demo dan hanya mengeluarkan jalur dan video yang direncanakan, Wayve.ai menggunakan 4700 jam data video dan dilatih selama 15 hari dengan 160 blok A100. Model dunia yang ingin dilatih NIO memerlukan data dan sumber daya komputasi yang jauh lebih tinggi.

Setelah pelatihan selesai, cara mengompresi dan memasukkan model dunia yang kompleks dan besar ke dalam Orin-X, yang memiliki daya komputasi dan bandwidth yang sangat terbatas, sekaligus memastikan akurasi dan kecepatan berjalan, adalah masalah kompleks lainnya.

Saat ini, Wei Xiaoli, yang pertama kali mencoba end-to-end (walaupun diterapkan dengan hati-hati), merasakan efek "menaikkan batas atas dan menurunkan batas bawah" dari end-to-end ke derajat yang berbeda-beda.

Misalnya, versi terbaru Xpeng, XNGP, telah memperoleh kemampuan memutar balik yang belum pernah terjadi sebelumnya, namun masukan menunjukkan bahwa kinerja berkendara cerdas pada kecepatan tinggi mengalami kemunduran.

Solusi end-to-end + VLM Ideal, yang sedang dalam pengujian internal, memiliki batas atas yang tinggi dan batas bawah yang berfluktuasi.

AEB ujung-ke-ujung yang didorong oleh NIO tidak hanya memiliki kinerja yang sangat menghindari pemeriksaan hantu dalam skenario non-standar seperti titik buta di tikungan, tetapi juga telah dikritik oleh pengguna karena peningkatan pengereman yang salah.


02 

Penelitian dan pengembangan L4, prospek L2?



Ketika batas bawah sulit untuk dipahami, perusahaan mobil selalu beralih ke end-to-end, terutama karena batas atas end-to-end akan menghasilkan peningkatan pengalaman pengguna yang memadai dan peluang bisnis yang sesuai.

Namun seiring dengan semakin banyaknya perusahaan mobil yang terlibat dalam end-to-end, sebuah pertanyaan masih melekat di benak mereka: Bisakah rasio input-output dari berkendara cerdas dihitung?

Untuk menjual lebih banyak FSD, Tesla menurunkan harga berlangganannya dari $199/bulan menjadi $99/bulan (harga pembelian turun dari $12.000 menjadi $8.000) pada bulan Maret tahun ini. Namun, pada bulan Mei tahun ini, sebuah lembaga konsultan data asing menganalisis informasi pembayaran kartu kredit dari 3.500 pengguna dan menilai bahwa tingkat konversi FSD hanya 2%, yang membuat Musk membantah rumor di X bahwa "tingkat konversinya jauh tolong lebih dari 2%."


Namun lebih dari 2% saja tidak cukup. Tesla sedang membangun klaster superkomputer di pabriknya di Texas yang diperkirakan akan mencapai 100.000 kartu H100/H200. Dengan harga preferensial US$25.000 per H100, belanja modal untuk pembelian kartu komputasi saja akan melebihi US$2,5 miliar (memperluasnya). membangunnya sebagai pusat data dan terus mengoperasikannya lebih tinggi) dan bernilaiBiaya berlangganan FSD untuk 2,08 juta kendaraan Tesla selama setahun penuh

Model bisnis mengemudi cerdas perusahaan mobil dalam negeri bahkan kurang optimis.

Pengeluaran penelitian dan pengembangan Xiaopeng untuk AI tahun ini adalah 3,5 miliar yuan. Bulan ini, Ideal telah menetapkan ambang pendanaan untuk mengemudi cerdas sebesar US$1 miliar. Namun, XNGP Xpeng dan NOA Ideal hadir sebagai standar dengan model kelas atas pembelian. NIO belum mengadopsi strategi gratis. Fungsi mengemudi cerdas kelas atas NOP+ dihargai 380 yuan per bulan. Ini sempat menghasilkan pendapatan, tetapi sekarang mobil baru hadir dengan periode penggunaan gratis NOP+ selama 1-2 tahun.

Termasuk Tesla, smart mengemudi kelas atas di dalam dan luar negeri masih dalam tahap merugi dan menghasilkan uang.

Kontradiksinya adalah setelah memasuki kompetisi NOA perkotaan dan beralih ke paradigma end-to-end, intensitas penelitian dan pengembangan mengemudi cerdas dari perusahaan-perusahaan ini sebenarnya telah diarahkan pada mengemudi otonom L3 dan bahkan L4. Namun, pasar arus utama masih memandangnya nilai sebagai "tidak sebanding dengan biaya tambahan untuk perangkat lunak". Mengemudi dengan bantuan L2 berbayar”.

Untuk mengatasi "kesenjangan antara nilai yang diharapkan dan nilai sebenarnya", tampaknya cara yang paling menjanjikan adalah dengan memasuki pasar penggerak otonom L4 terbesar, Robotaxi.

Pada tahun 2018, Morgan Stanley menilai Robotaxi Waymo sebesar US$80 miliar. Penggemar terbesar Musk, Mu Jie dari Ark Investment, memberikan prediksi pada bulan Juni tahun ini bahwa pendapatan Tesla Robotaxi akan “secara konservatif” mencapai US$603 miliar pada tahun 2029, meningkatkan nilai pasar Tesla hingga mencapai 7 triliun dolar pada saat itu.

Sebelumnya, Musk mengumumkan di Twitter bahwa ia akan meluncurkan model Robotaxi pada bulan Agustus (sudahditunda hingga 10 Oktober).


03

Pengembalian bisnis belum merupakan suatu keajaiban


Apakah Robotaxi akan dilakukan atau tidak telah menjadi pertanyaan hangat di hadapan Wei Xiaoli tahun ini.

Untuk Xpeng yang paling dekat dengan Tesla, jawabannya YA. Pada bulan Juli, He Xiaopeng secara terbuka mengungkapkan bahwa Xpeng Motors akan meluncurkan Robotaxi pada tahun 2026.

He Xiaopeng percaya bahwa persyaratan perangkat keras Robotaxi jauh lebih kompleks dari yang dibayangkan, tetapi kombinasi algoritma perangkat lunak end-to-end + model besar yang dapat berkembang pesat sudah cukup untuk menyelesaikan masalah mengemudi otonom L4. Tujuan He Xiaopeng untuk tim adalah pada paruh kedua tahun 2025, pengalaman XNGP akan dibandingkan dengan Robotaxi Google Waymo.

Namun, manufaktur mobil sendiri sudah menjadi bisnis yang banyak aset, membangun sejumlah besar Robotaxi dan mengoperasikan aPlatform pemesanan taksi tanpa pengemudi akan memperpanjang rantai bisnis dan siklus pengembalian investasi tanpa batas.Google menginvestasikan US$5 miliar di Waymo tahun ini, dan mustahil Xpeng menjadi begitu kaya.

Dari bulan Juni hingga Juli, He Xiaopeng mengunjungi CEO Didi Cheng Wei dan CEO Uber Dara Khosrowshahi. Ia mengatakan Xpeng tidak ingin mengoperasikan Robotaxi, namun berharap dapat mengekspor model dan teknologi penggerak otonom ke mitra global.

Robotaxi milik Uber, kini bermitra dengan Hyundai


Pendekatan perusahaan mobil terhadap Robotaxi end-to-end telah menarik reaksi keras dari banyak praktisi mengemudi otonom L4, termasuk mantan CEO TuSimple Hou Xiaodi, CTO Pony.ai Lou Tiancheng, dan Presiden Qingzhou Zhihang Hou Cong. Beberapa dari mereka dengan marah mengkritik mitologi perusahaan mobil yang menyeluruh, dan beberapa mengatakan bahwa sistem kemampuan yang relevan dari perusahaan mobil tidak tepat, namun argumen intinya tetap sama:

Meskipun perusahaan mobil mengemudi cerdas kelas atas telah membuat kemajuan pesat, hal ini pada dasarnya dirancang dalam kerangka mengemudi berbantuan. Tujuan utama yang menjadi perhatian adalah kegunaan dan biaya, dan hal terpenting bagi Robotaxi adalah keandalan dan keamanan. Tujuan yang berbeda menyulitkan keduanya untuk menggunakan perangkat lunak dan perangkat keras yang sama, dan sulit bagi perusahaan mobil untuk melakukan transisi dengan lancar dari mengemudi cerdas kelas atas ke Robotaxi [1] [2] [3].

Ini berperan dalam hati Li Bin. Dalam sebuah wawancara pada 27 Juli,Dia menjelaskan bahwa dia “tidak menganggap Robotaxi adalah pencapaian atau model bisnis yang menarik” dan dengan marah menyatakan:

“Nilai dari berkendara cerdas bukan berarti menghilangkan kerja keras para sopir dan supir taksi saat ini.”

Alasan lain mengapa dia tidak optimis dengan robotaxi adalah karenaKarena keterbatasan sumber daya jalan dan peraturan pemerintah, robotaxi tidak dapat diluncurkan tanpa batas, sehingga sulit untuk memiliki model bisnis dengan keuntungan marjinal yang tinggi seperti layanan cloud perangkat lunak.

Li Bin selalu menegaskan bahwa orang ingin memiliki mobil sendiri, jadi tujuan NIO Smart Driving adalah membantu pengemudi mengosongkan energi dan mengurangi kecelakaan. Kata kunci dari jalur bisnis ini adalah efek skala - menjual lebih banyak mobil ke pengguna biasa, dan Pengguna dengan biaya berlangganan yang memadai akan dikenakan biaya berlangganan untuk mengemudi cerdas kelas atas, mengurangi biaya, dan memperoleh pendapatan.

Namun, dalam menghadapi mengemudi cerdas yang berbiaya tinggi, skala pengguna kumulatif NIO yang kurang dari 600.000 masih belum cukup, dan mengekspor kemampuan mengemudi cerdas telah menjadi sebuah pilihan. Ren Shaoqing, penanggung jawab mengemudi cerdas NIO, baru-baru ini untuk pertama kalinya menyatakan kesediaan NIO untuk membuka solusi mengemudi cerdasnya kepada perusahaan mobil lain, seperti keterbukaan NIO terhadap pertukaran baterai.

Sebaliknya, "penilaian teknis radikal dan strategi bisnis Li Xiang konservatif" untuk Zhijia.

Li Xiang menetapkan bendera di Forum Otomotif Chongqing tahun ini bahwa kombinasi end-to-end + VLM akan mencapai tingkat mengemudi otonom L4 dalam waktu tiga tahun. Namun bedanya, Ideal tidak pernah memikirkan bisnis Robotaxi. Bahkan sejauh ini, Ideal belum menunjukkan minat untuk mengenakan biaya untuk perangkat lunak mengemudi cerdas. Logo di situs resminya masih "mengemudi cerdas untuk semua skenario, tanpa biaya berlangganan seumur hidup".

Hal ini terkait dengan situasi persaingan yang ideal. Setahun terakhir, cita-cita dihadapkanHongmeng Zhixing, penjualan mengalami tekanan yang signifikan. Tombak paling tajam dari Hongmeng Zhixing adalah kemampuan berkendara cerdas ADS Huawei.

Pada saat Hongmeng Zhixing melonjak dengan Huawei ADS 3.0 (harga pembelian sekitar 10.000 yuan) dari semua lapisan masyarakat, semakin memberikan tekanan pada Ideal, smart drive AD MAX dari Ideal, yang lebih mudah digunakan daripada sebelumnya tetapi gratis, dapat membantu ambil lebih banyak pesanan berganda. Berbeda dengan Xpeng dan NIO, KPI smart Driving yang ideal bukanlah memperoleh pendapatan operasional, melainkan melayani penjualan.

Namun, ketika industri otomotif dalam negeri memasuki tahap knockout, bisnis mengemudi cerdas Wei Xiaoli tidak dapat bertahan lama dalam menjalin pertemanan.

Biaya kartu pelatihan mulai dari 100.000 yuan, dan biaya tenaga kerja untuk tim yang terdiri dari seribu orang mulai dari 1 miliar per tahun. Sebagai salah satu bisnis Wei Xiaoli yang paling mahal, Zhijia telah memulai jalan yang lebih memakan sumber daya untuk mencapai kesuksesan besar. keberhasilannya, namun masih penuh ketidakpastian apakah hal ini juga dapat menuai hasil dari upaya yang ajaib.

Referensi:

[1] Hou Xiaodi, pria pemberani yang berhati-hati, Jiazi Guangnian

[2] Berbicara dengan Lou Tiancheng tentang Robotaxi: "Semakin kuat L2, semakin jauh jaraknya dari L4", Tencent Auto

[3] Tesla membuat Robotaxi sederhana |. Percakapan dengan Hou Cong, salah satu pendiri Qingzhou Zhihang, Yunjian Insight