berita

Mengapa semua perusahaan mobil mengatakan ingin menjadi perusahaan AI?

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Beberapa perusahaan mulai membangun “otak” untuk mobil pintar


Penulis |.Cao Siqi
sunting|.Jingyu

“Perusahaan kendaraan listrik pintar yang sukses harus menjadi perusahaan AI yang sukses.”

Ini adalah ekspresi paling modis di bidang otomotif dalam dua tahun terakhir, dan yang terbaru datang dari CEO NIO Li Bin. Li Bin sekarang sering menyembunyikan sederet gelar seperti pengusaha dan investor, dan menyebut dirinya sebagai orang yang bermedia mandiri. Tujuan utamanya adalah agar lebih banyak orang mengetahui Weilai yang sebenarnya, dan dia tidak bisa dicap sebagai "pelayanan yang baik" karena dia masa lalu. Saya pikir teknologi NIO tidak bagus.

Dia berkata: "Inovasi adalah fondasi NIO."

NIO bukan satu-satunya yang melontarkan ekspresi serupa. Di masa lalu, setiap perusahaan mobil memiliki labelnya masing-masing, seperti kontrol, kemewahan, tenaga, ekonomi... Namun kini, setiap orang memiliki konsensus baru: melabeli diri mereka sebagai AI.


Li Bin dan Qin Lihong berbagi pemikiran terbaru NIO di bidang inovasi teknologi |

Menjadikan mobil lebih cerdas adalah isu utama yang pertama, dan ini juga merupakan kemampuan penting yang perlu ditunjukkan oleh perusahaan mobil kepada pengguna sesegera mungkin pada tahap ini.

Namun tiga kata “semakin pintar” sendiri merupakan gambaran yang sulit diukur. Apa yang membuat mesin pintar? Mira Murati, chief technology officer OpenAI, pernah mencoba membandingkan kemampuan model AI dengan tingkat kecerdasan manusia dalam podcast: GPT-4 setara dengan siswa sekolah menengah yang cerdas, sedangkan GPT-5 diharapkan mencapai level a Ph.D.

Meski pernyataan ini mudah dipahami, namun sebenarnya sulit diterapkan langsung pada mobil.Karena dibandingkan dengan model besar itu sendiri, mobil pintar, sebagai pembawa perangkat keras cerdas yang sangat besar, tidak hanya harus memiliki “kecerdasan” untuk memahami masalah, tetapi juga memecahkan masalah melalui “kemampuan” tertentu.

Jika mobil pintar diibaratkan robot, maka dalam proses menjadikan "orang" tersebut pintar, diperlukan "otak pintar" - tidak hanya harus memiliki kecerdasan model itu sendiri; seperangkat manajemen tugas untuk "badan" dan sistem alokasi untuk menentukan prioritas yang diperlukan oleh "organ" yang berbeda untuk menangani serangkaian tugas yang berbeda pada waktu yang berbeda.

Misalnya: Suspensi aktif adalah fitur baru yang sangat populer dalam dua tahun terakhir. Intinya adalah memungkinkan kendaraan menyesuaikan parameter suspensi selama berkendara berdasarkan memori dan perhitungan untuk mengatasi ketidakrataan permukaan jalan yang berbeda, sehingga menghadirkan pengalaman berkendara yang lebih baik. . Hal ini melibatkan kerja sama antara berbagai bidang seperti sasis dan penggerak cerdas. Jika tidak ada koordinasi otak yang terpadu, karena masalah teknis seperti bandwidth dan penundaan, kerja sama akan mudah menjadi tidak terkoordinasi dan pengalaman yang diinginkan tidak akan tercapai.

Pada tanggal 27 Juli, di Hari Inovasi dan Teknologi NIO IN NIO 2024, NIO merilis "otak kendaraan" - SkyOS, sistem operasi global kendaraan. Ini mewakili pemikiran NIO di era AI: Menurut laporan, berdasarkan sistem ini, sistem ini dapat memberikan pengalaman yang lebih baik dalam pelaksanaan tugas lintas domain, alokasi daya komputasi, dll.

Dan semua upaya ini ditujukan untuk tujuan yang sama: membuat mobil pintar menjadi lebih pintar.


01

model dunia,

Biarkan mobil pintar "bernalar"

Mengemudi cerdas adalah pemandangan yang paling menarik perhatian ketika AI digunakan di mobil, dan ini juga merupakan area di mana rute teknis mengalami perubahan paling cepat dalam beberapa tahun terakhir.

Dalam beberapa tahun terakhir, mengemudi cerdas telah melalui beberapa iterasi pada jalur teknisnya, termasuk beralih dari solusi peta presisi tinggi ke mode tanpa peta, dan beberapa perusahaan yang diwakili oleh Tesla telah mencoba rute visual murni (tanpa lidar).

Namun, peralihan rute ini pada dasarnya hanya untuk mengurangi biaya dan tidak mengubah sifat mengemudi cerdas yang “didorong oleh aturan”. Sistem ini masih membutuhkan banyak pemrogram untuk meluangkan waktu menulis kode dan memperbaiki bug. Dengan kata lain, ini hanyalah sebuah proses di mana manusia menerjemahkan pengetahuannya tentang mengemudi ke mesin melalui bahasa pemrograman. Sistem mengemudi cerdas itu sendiri tidak menghasilkan kecerdasan.

Munculnya teknologi end-to-end telah mengubah seperangkat aturan ini. Berbasis aturan berkembang menjadi berbasis data. Manusia mencoba meniru Hukum Scalling yang telah terbukti berhasil di bidang model bahasa besar. Dengan memasukkan data video dalam jumlah besar, sistem penggerak cerdas dilatih menjadi besar model jaringan saraf yang dapat memunculkan kecerdasan.

Hasil paling ideal dari model ini adalah model pemikiran mengemudi manusia yang pernah dijelaskan Musk, yaitu: input video (informasi jalan yang dilihat), output kontrol (pengendali pedal dan arah).


Diagram arsitektur mengemudi cerdas ujung ke ujung |. Sumber gambar: NIO

Dengan menerapkan teori "tiga landasan AI", untuk mencapai tujuan ini, kita perlu memecahkan tiga masalah utama yaitu daya komputasi, algoritma, dan data.

NIO mengadopsi pendekatan "swarm intelijen" terhadap data, yaitu memperoleh sejumlah besar data nyata berdasarkan sejumlah besar kendaraan produksi massal yang sudah diinstal sebelumnya dengan daya komputasi tinggi dan perangkat keras penginderaan kelas atas. Menurut laporan,

Kekuatan komputasi merupakan masalah eksternal dan tidak ditentukan oleh perusahaan mobil itu sendiri.

Oleh karena itu, fokus tahap selanjutnya adalah memulai dari algoritma itu sendiri dan meningkatkan efisiensi pelatihan dan kemampuan penalaran model itu sendiri. Jawaban yang selanjutnya diberikan oleh NIO adalah: Nio World Model (selanjutnya disebut NWM).

Anda dapat menganggap NWM sebagai varian dari Sora, dan sampai batas tertentu merupakan produk generasi video. Perbedaan kecilnya adalah Sora masih didasarkan pada "Vincent Video", sedangkan model dunia NIO adalah sejenis "Video Born Video": Menurut pengenalan resmi, NWM dapat menggunakan video mengemudi nyata berdurasi 3 detik sebagai kata cepat untuk menghasilkan Video berdurasi hingga 120 detik.


NIO menggambarkan tanggung jawab NWM sebagai “menyimpulkan ribuan dunia paralel” |

Namun pembuatan video jelas bukan tujuan NIO, dan NIO tidak ingin menggunakan video yang dihasilkan oleh NWM sebagai data pelatihan.

Masih menggunakan model pemikiran manusia sebagai analogi: sebelum pengemudi manusia memilih untuk menyalip, dia akan menilai perubahan jalur yang berbeda dan memilih peluang menyalip yang berbeda berdasarkan kondisi jalan real-time. Proses pengambilan keputusan dan penalaran ini diungkapkan secara konkrit oleh NWM melalui video yang dihasilkan.

Menurut pengenalan resminya, NWM dapat menyimpulkan 216 kemungkinan skenario dan menemukan solusi optimal dalam waktu 100 milidetik.

Oleh karena itu, kemunculan NWM sebenarnya menemukan jalan baru bagi sistem penggerak cerdas menjadi lebih cerdas dengan metode kerja baru (end-to-end) melalui jalur teknis AI generatif.

02

Temukan "sentuhan manusia" di kokpit

Skenario penerapan AI mendalam lainnya pada mobil adalah kokpit pintar.

Jika Anda pernah merasakan masing-masing "mobil tradisional" dan "mobil pintar yang luar biasa", Anda mungkin tidak akan berpikir bahwa berbagai fungsi di kokpit pintar itu hanya sekedar kemewahan. Penulis selalu percaya bahwa cara paling aman untuk berinteraksi antara manusia dan kendaraan saat berkendara adalah melalui suara - hal ini dapat memastikan mata dan tangan Anda terus fokus saat mengemudi.

Dapat dikatakan bahwa dalam hal kecerdasan kokpit, kekuatan pembuat mobil baru dengan gen Internet jelas berada di depan banyak perusahaan mobil tradisional.

Sekarang, ketika gelombang AI tiba, mereka sudah mulai menghadapi pilihan berikutnya, seperti yang dikatakan mantan ketua dewan Alibaba Zhang Yong:

Gunakan metode AI untuk mengulang semua produk.


NIO berharap dapat menggunakan AI untuk mendefinisikan kembali paradigma interaksi manusia-kendaraan |

Untuk saat ini, NIO pada dasarnya telah memindahkan semua perangkat lunak AI arus utama dan gameplay perangkat keras yang saat ini ada di pasaran ke mobil.

Misalnya, musik AI+ menggunakan algoritme kualitas suara bertenaga AI untuk mengoptimalkan sumber suara yang tidak memiliki suara panorama, lalu menggunakan perangkat keras milik mobil untuk memutarnya.

Dengan dukungan AI, fungsi penjaga parkir menjadi produk serupa notulen konferensi video. AI akan menyaring dan menghasilkan momen-momen penting yang patut diperhatikan. Jika sayangnya Anda mengalami goresan saat parkir, produk ini dapat menjadi alat peningkatan efisiensi.

Ada juga fungsi memori perjalanan yang akan segera tersedia. Konferensi pers menunjukkan vlog yang secara otomatis diedit dan dibuat berdasarkan pemandangan sepanjang perjalanan yang ditangkap oleh kamera onboard setelah perjalanan self-driving juga ditandai dengan lokasi. Fungsi pengeditan AI serupa pernah digunakan dalam adegan seperti kamera aksi di masa lalu, dan kini NIO juga memasukkannya ke dalam mobil.

Selain itu, NIO juga mendemonstrasikan evolusi NOMI dengan dukungan kemampuan multi-modal: ia dapat melihat isyarat "ssst" dan secara otomatis menurunkan volumenya; ia juga dapat mengekspresikan kepedulian emosional yang sesuai berdasarkan lingkungan yang berbeda.

NIO menggunakan "kecerdasan emosional" untuk menggambarkan evolusi AI di bidang kokpit. Namun menurut penulis, fungsi-fungsi tunggal ini tidak membuat terobosan besar dalam kemampuan AI itu sendiri. Sebaliknya, skenario penerapan praktis ini dipertimbangkan, dan keputusan untuk mengimplementasikannya patut mendapat perhatian. Di bidang kokpit, mungkin penambangan skenario aplikasi saat ini mendahului evolusi kemampuan model.

Pada malam tanggal 27 Juli, Li Bin menyelesaikan wawancara medianya dan mengikuti siaran langsung online lainnya hampir tanpa henti. Seperti yang sering terjadi di masa lalu ketika dia berbicara secara online, dia menghadapi beberapa pertanyaan yang memalukan atau tajam, jadi dia memilih untuk membacanya secara langsung:

"Berhentilah main-main dengan Douyin setiap hari dan kelola perusahaan dengan hatimu."

Li Bin tersenyum dan menjelaskan bahwa ini hanya siaran langsungnya yang kelima.Namun seperti ide-ide kecil yang cerdik yang tersembunyi di dalam kokpit pintar dan mungkin tidak banyak digunakan saat ini, dia merasa bahwa pemikiran dan upaya NIO dalam inovasi perlu diperkenalkan kepada semua orang. “Jika tidak, semua orang akan membicarakan layanan NIO setiap hari. Yah, sepertinya kemampuan kita tidak bagus.”

Yang pasti, ungkapan tersebut mendapat banyak tanggapan positif. Li Bin menertawakan dirinya sendiri pada pertemuan komunikasi media. Dulu, orang mengatakan mereka tidak akan membeli mobil karena satu orang (mengacu pada Li Bin sendiri). sangat senang dia bisa melakukan ini.

Qin Lihong di samping menambahkan: Dulu yang paling dinantikan semua orang adalah NIO DAY (NIO Day, acara terbesar bagi pemilik mobil NIO) di penghujung tahun media dan pemilik mobil di masa depan.

Semoga hari ini datang secepatnya.

*Sumber gambar header: NIO

Artikel ini adalah artikel asli oleh Geek Park. Untuk pencetakan ulang, silakan hubungi Geek Jun di WeChat geekparkGO

Geek bertanya

Apa pendapat Anda tentang mengemudi cerdas?Apa harapannya?

Musk: Media sosial itu palsu dan secara bertahap menghancurkan kepercayaan diri Anda.

Sukai dan ikutiAkun Video Geek Park