berita

Mengemudi cerdas menyeluruh: Dulunya menghasilkan jutaan dolar setahun, kini cemas menjadi pengangguran

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teks丨Anqi Li

Editor丨Li Qin

“Ambil pendekatan end-to-end, atau tinggalkan industri mengemudi cerdas dalam beberapa tahun.”

Setelah memasuki industri mengemudi cerdas selama beberapa tahun, insinyur mengemudi cerdas Qin Feng (nama samaran) telah beradaptasi dengan pesatnya laju involusi dalam industri mengemudi cerdas. Namun ketika teknologi baru "model besar end-to-end" hadir, dia merasa bahwa orang pertama yang terkena dampaknya mungkin bukan pengemudi manusia, melainkan dirinya sendiri sebagai seorang insinyur.

Kecemasan semacam ini tidak hanya terjadi pada Qin Feng. Banyak insinyur mengemudi cerdas mengatakan kepada 36Kr bahwa untuk mempelajari teknologi baru, mereka membaca makalah industri terbaru selama kerja lembur, pergi ke Bilibili untuk menghadiri kuliah, dan beberapa bahkan mulai belajar dari buku pelajaran sekolah pascasarjana.

"Model besar ujung ke ujung" adalah bom teknologi terbaru dalam industri mengemudi cerdas tahun ini.

Pada bulan Januari tahun ini, Tesla secara resmi meluncurkan versi uji FSD (paket perangkat lunak mengemudi otonom) v12 untuk pengguna biasa. Versi ini mengadopsi solusi jaringan end-to-end, dan banyak pengguna mengatakan pengalamannya jauh lebih ramah pengguna dibandingkan versi v11 sebelumnya.

Musk pernah memperkenalkan kemampuan end-to-end, menyebutnya “masukan akhir gambar, keluaran akhir kendali.” Meskipun banyak orang dalam industri menyatakan kepada 36Kr bahwa mereka tidak percaya bahwa solusi end-to-end Tesla begitu radikal dan ajaib pada tingkat praktis, solusi end-to-end masih mendorong rekan-rekan domestik seperti madu. Para pemain domestik secara bertahap percaya bahwa didorong oleh model yang besar, daya komputasi yang besar, dan data yang sangat besar, sistem AI dapat bergerak seperti manusia.

Merasakan tren teknologi baru, perusahaan mobil dalam negeri dan perusahaan mengemudi cerdas terkemuka telah mengambil tindakan. Pemain terkemuka seperti Huawei, NIO, dan BYD telah menginvestasikan tim dan sumber daya untuk mempromosikan solusi menyeluruh; dua perusahaan mobil, Ideal dan NIO, juga telah membentuk departemen model skala besar yang berdedikasi dan menyeluruh untuk mempercepat penerapan teknologi .

Persaingan untuk mendapatkan talenta-talenta kelas atas juga meningkat secara terbuka dan terselubung. Ketika mobil pertama diluncurkan di pasar, untuk mengejar kemajuan mengemudi cerdas, Xiaomi mempekerjakan mantan CTO Tucson China Wang Naiyan untuk bergabung dengan perusahaan tersebut. Beberapa orang di industri mengemudi cerdas mengatakan kepada 36Kr bahwa Huawei Smart Driving bahkan menggunakan paten yang relevan untuk menyalurkan talenta dan melakukan penambangan yang ditargetkan.

Rencana baru tersebut memang tengah menggairahkan pasar dalam negeri. Namun sisi lain dari hal ini adalah end-to-end sangat bergantung pada implementasi berbasis data dibandingkan penumpukan manual dari sejumlah besar insinyur. Ukuran tim Tesla yang berjumlah sekitar 300 orang digunakan sebagai model dan disebar di antara para pemain terkemuka.

Namun, kenyataan di industri ini adalah bahwa tim penggerak cerdas yang terdiri dari para pemain terkemuka saat ini memiliki hampir seribu talenta. BYD, sebuah perusahaan mobil mapan yang mengejar ketertinggalan dalam berkendara cerdas, memiliki tim perangkat lunak yang terdiri dari 3.000 orang, dan tim mengemudi cerdas Huawei juga tidak ketinggalan. Ketika pasar sedang bagus, para insinyur umumnya bisa mendapatkan paket gaji dengan gaji tahunan jutaan.

Namun, banyak insinyur mengemudi cerdas percaya bahwa jika efek dari solusi end-to-end diverifikasi lebih lanjut, PHK dalam tim mengemudi cerdas di perusahaan mobil akan menjadi peristiwa yang sangat mungkin terjadi.

"Tidak perlu 200-300 orang," kata mantan tulang punggung mengemudi cerdas untuk perusahaan mobil bertenaga baru kepada 36 Krypton. Bahkan lulusan baru dengan latar belakang pembelajaran yang mendalam mungkin memiliki keunggulan dibandingkan beberapa insinyur mengemudi cerdas yang memasuki proyek end-to-end.

Beberapa headhunter pengemudi yang cerdas juga jelas merasa bahwa industri ini dipenuhi dengan talenta: tim pengemudi yang cerdas di perusahaan mobil tidak lagi melepaskan posisi baru, dan personel mulai disederhanakan. “Banyak HC yang berkeliaran adalah posisi zombie.” dari seorang headhunter, dia telah beralih jalur dan beralih merekrut talenta untuk perusahaan robotika.

Insinyur diblokir di luar pintu

Insinyur mengemudi cerdas Tian Wei (nama samaran) mengatakan kepada 36Kr bahwa dalam revolusi teknologi baru ini, para insinyur di modul perencanaan dan pengendalian akan lebih terkena dampaknya daripada modul persepsi dan modul prediksi.

Hal ini terutama karena solusi end-to-end sangat berbeda dengan solusi berkendara cerdas tradisional. Solusi tradisional dibagi menjadi beberapa modul seperti persepsi, penentuan posisi, peta, prediksi, dan kontrol perencanaan. Implementasi fungsi modul pada dasarnya didorong oleh kode insinyur. Personil dari dua departemen utama yaitu persepsi, perencanaan, dan pengendalian sering kali merupakan mayoritas dalam tim penggerak cerdas.

Namun karakteristik dari solusi end-to-end adalah solusi tersebut berubah dari berbasis kode oleh para insinyur menjadi berbasis data. Cara paling ideal adalah dengan memasukkan gambar ke sistem, dan sistem dapat langsung mengeluarkan kendali kendaraan, dan tautan perantara diselesaikan oleh jaringan saraf AI.

Dilihat dari kemajuan para pemain terkemuka di dalam negeri, setelah diperkenalkannya solusi end-to-end, beberapa modul dari solusi tradisional diubah melalui jaringan saraf AI dan diintegrasikan ke dalam dua jaringan besar: model persepsi besar dan prediksi besar dan model pengambilan keputusan. “Banyak solusi saat ini didasarkan pada model persepsi besar dan terhubung dengan model perencanaan prediktif yang besar.”

Solusi lebih lanjut akan mengintegrasikan persepsi, prediksi, pengambilan keputusan dan perencanaan, yang oleh industri disebut “Satu Model”.

Rute teknis baru ini juga memiliki profil bakat baru untuk tim pengemudi cerdas di perusahaan mobil.

Seorang pengemudi yang cerdas memberi tahu 36Kr bahwa tim ujung ke ujung membutuhkan lebih sedikit orang, tetapi persyaratan ambang batas bakat menjadi lebih tinggi. Model besar sendiri mengharuskan tim memiliki latar belakang pembelajaran mendalam yang kuat. “Dalam fase project building juga membutuhkan talenta infrastruktur (infrastruktur) yang kuat, pemahaman yang mendalam terhadap setiap modul persepsi, perencanaan dan pengendalian, serta pemahaman yang berbeda-beda. platform komputasi chip, kerangka kerja penalaran AI yang berbeda, dll.”

Namun, jumlah orang yang bertanggung jawab atas konstruksi model dan pelatihan hanya mencakup sebagian kecil. "Mungkin 90% tim menyediakan data menyeluruh, serta dukungan rantai alat data tertutup, dll."

“Model besar itu sendiri adalah tim yang sangat cakap.” Inilah sebabnya mengapa perusahaan teknologi AI seperti OpenAI hanya memiliki 200-300 orang pada awalnya, namun mereka mampu meluncurkan model bahasa besar ChatGPT dan mengubah proses AI global.

Bagi para insinyur, dampak teknologi end-to-end juga bervariasi.

Seorang pakar mengemudi cerdas mengatakan kepada 36Kr bahwa di antara dua modul persepsi dan kontrol, model persepsi besar awalnya mengandalkan teknologi pembelajaran mendalam. Meskipun rute inspeksi visual telah bergeser dari jaringan saraf konvolusional CNN sebelumnya ke BEV berbasis Transformer, dampaknya terhadap para insinyur tidak terlalu besar.

Namun bagi para insinyur regulasi, jika mereka ingin bergabung secara end-to-end, mereka hampir harus berpindah jalur lagi. Seorang pakar mengemudi yang cerdas mengatakan kepada 36Kr bahwa regulasi tradisional dan insinyur kontrol terutama berfokus pada beberapa arah: prediksi jalur, optimalisasi jalur, pasca-pemrosesan aturan, dan pengendalian kendaraan. "Semuanya adalah mata pelajaran yang sangat terbagi dan pada dasarnya tidak relevan. Kecuali modul prediksi jalur, insinyur di bidang lain pada dasarnya tidak memiliki latar belakang pembelajaran yang mendalam."

Insinyur mengemudi cerdas Tian Wei mengatakan kepada 36Kr bahwa jika regulator ingin beralih ke end-to-end, salah satu arahnya adalah pelatihan model itu sendiri, namun hal ini memerlukan latar belakang pembelajaran mendalam yang kuat. “Ada kemungkinan bahwa lulusan baru yang mempelajari pembelajaran mendalam memahami model lebih baik daripada Anda.”

Kedua, penambangan dan pemrosesan data untuk menyediakan nutrisi data end-to-end. “Tetapi jika infrastruktur rantai alat selesai dan struktur model distabilkan, manusia mungkin tidak lagi dibutuhkan.” Terakhir, ada model pasca-pemrosesan. Keluaran lintasan dari model besar ujung ke ujung tidak dapat dipercaya dan masih membutuhkan sejumlah kecil insinyur untuk menulis. Aturannya jelas.

Para insinyur juga mengkhawatirkan hal ini. “Di satu sisi, model besar end-to-end itu sendiri tidak membutuhkan banyak orang. Di sisi lain, semua orang ingin melakukan end-to-end, tetapi bisnis produksi massal perusahaan membutuhkan orang untuk menjalankannya.”

Seorang karyawan Zhijia juga kesal karena dia kehilangan kesempatan untuk bergabung dengan tim proyek end-to-end karena proyek produksi massal perusahaan saat ini. Tapi dia juga sangat terjerat: bahkan jika dia memasuki solusi end-to-end, itu untuk mendukung solusi baru, tapi ini bukan posisi inti model besar itu sendiri;

Dan jika Anda tetap berada di posisi proyek produksi massal saat ini, Anda dapat mengumpulkan pengalaman lengkap dalam proyek produksi massal mengemudi cerdas, dan itu juga dapat ditransfer ke perusahaan mobil tradisional dalam beberapa tahun ke depan.

Namun bahaya lain akan datang. Begitu solusi end-to-end dipopulerkan di seluruh industri, tumpukan teknologi yang telah dia kumpulkan selama bertahun-tahun juga akan menghadapi risiko terhapuskannya dalam beberapa tahun. “Saya mungkin harus meninggalkan industri mengemudi cerdas.”

Divisi teknologi, permainan sumber daya

Untuk berpindah ke tim proyek end-to-end, insinyur Tian Wei memulai langsung dari program pascasarjana dalam pembelajaran mendalam.

Dia menemukan kursus klasik tentang pembelajaran mendalam dan kartu grafis, dan menggunakan kursus praktis di buku teks untuk menerapkan beberapa algoritma pengenalan gambar sederhana. “Setidaknya Anda harus terlebih dahulu memahami poin-poin pengetahuan secara menyeluruh sebelum Anda dapat memahami cara kerja model itu sendiri.”

Setelah dua bulan membaca dan berlatih, Tian Wei akhirnya merasa bahwa dia dapat memahami beberapa kode sumber terbuka model besar end-to-end. Dia telah melamar ke perusahaan untuk dipindahkan ke tim proyek end-to-end.

Faktanya, bukan hanya Tian Wei yang cemas, tetapi perusahaan pengemudi pintar tempat Tian Wei bekerja bahkan lebih cemas daripada dia. Dia mengatakan kepada 36Kr bahwa perusahaannya bekerja sama dengan perusahaan mobil untuk mengembangkan solusi produksi massal untuk mengemudi cerdas, tetapi ada juga tim di dalam perusahaan mobil yang melakukan promosi secara end-to-end sudah memulai rencana end-to-end.”

Tian Wei mengatakan bahwa menurut pemahaman perusahaan, demo end-to-end dapat dilatih hanya dengan data video berdurasi 2,000 jam, dan tingkat data ini dapat diselesaikan dalam satu atau dua bulan menggunakan 50 kendaraan.

Namun Tian Wei tahu betul bahwa dengan sumber daya yang dimiliki perusahaan, mereka hanya dapat mendukung pelatihan demo end-to-end untuk membuktikan kelayakan solusi. Masih ada kesenjangan besar antara demo dan produksi massal.

Permainan divisi teknologi baru ini pertama-tama akan tercermin pada divisi sumber daya.

CEO Tesla Musk pernah menekankan pentingnya data untuk end-to-end: "Pelatihan dengan 1 juta kasus video saja tidak cukup; dengan 2 juta, itu sedikit lebih baik; dengan 3 juta, Anda akan merasa Wow Ketika itu tercapai." 10 juta, sungguh sulit dipercaya.”

Di sisi lain, terdapat sumber daya komputasi. Musk juga membeli pelatihan kartu grafis NVIDIA dalam skala besar, dengan mengatakan bahwa pada akhir tahun, kekuatan komputasi pelatihan kecerdasan buatannya akan setara dengan kekuatan komputasi 90.000 NVIDIA H100. Cadangan dan permintaan daya komputasi sangat besar.

Ambang batas ini cukup tinggi. Bagi perusahaan smartdriving yang masih kesulitan menghasilkan uang, di satu sisi tidak bekerjasama dengan perusahaan mobil, sehingga sulit bagi perusahaan smartdriving untuk mengumpulkan data pelatihan sendiri, di sisi lain chip pelatihan cloud sulit untuk menemukannya di Cina. Banyak perusahaan mobil yang memperolehnya dengan harga tinggi. “Proyek produksi massal dan pembiayaannya masih belum jelas, dan sulit untuk berinvestasi dalam investasi jangka panjang end-to-end.”

Insinyur mengemudi cerdas lainnya juga merasa tidak berdaya. Setelah mengembangkan proyek end-to-end selama kurang dari setengah tahun, dia menerima pemberitahuan dari perusahaan untuk menangguhkan proyek end-to-end. Alasannya adalah bahwa perusahaan perlu memusatkan energi dan sumber dayanya untuk mengembangkan solusi mengemudi cerdas tanpa peta perkotaan, yang “menghabiskan terlalu banyak sumber daya secara end-to-end.”

Yang dirasakan sang insinyur adalah sayang sekali bahwa demo end-to-end yang dibuat oleh timnya sudah siap untuk dijalankan. Tim awalnya bertujuan untuk mengukur FSD Tesla, dan bahkan menghabiskan upaya besar untuk membangun rantai alat dan infrastruktur lainnya. Namun dengan penangguhan strategi end-to-end perusahaan, fokus penelitian dan pengembangan tim telah beralih ke bidang robotika.

Teknologi baru yang menyeluruh belum benar-benar diterapkan di Tiongkok, namun dampaknya terhadap pembentukan kembali struktur talenta dan struktur ekologi industri mengemudi cerdas sudah mulai terlihat.

Meskipun demikian, para pemain terkemuka akan tetap berusaha semaksimal mungkin untuk mengikuti tren disruptif ini, dan era raksasa yang mengendalikan sumber daya data, sumber daya chip, dan sumber daya manusia akan datang.

(Qin Feng dan Tian Wei adalah nama samaran dalam artikel tersebut.)