berita

Apa yang tersisa dari model besar yang mendarat di tepian?

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Ketika model-model besar memulai proses pemberdayaan industri, penerapan skala besar mereka di edge/side telah menjadi prioritas utama untuk pengembangan lebih lanjut. Namun, penerapan di edge/side tentunya lebih kondusif untuk mencapai respons instan dan perlindungan privasi untuk model besar, namun juga akan menghadapi tantangan dalam hal fragmentasi daya komputasi, masalah efisiensi energi, dan skenario implementasi. Bagi perusahaan, hal ini merupakan kesulitan sekaligus peluang.

Didorong oleh kebutuhan aplikasi industri, model-model besar berkembang ke arah yang lebih maju.

Saat ini, industri model besar di negara saya sedang mengalami perkembangan pesat. Statistik menunjukkan bahwa hingga akhir Maret, jumlah model besar yang dirilis di Tiongkok telah mencapai 117. Namun, dalam proses pengembangannya, tidak seperti Amerika Serikat yang berfokus pada terobosan orisinal, perusahaan model besar Tiongkok lebih menekankan pada implementasi aplikasi. Zhou Hongyi, pendiri dan ketua 360 Group, mengatakan dalam pidato sebelumnya bahwa model volume, daya komputasi, dan data bukanlah satu-satunya pilihan untuk mengembangkan model menuju triliunan parameter. Model besar kecerdasan buatan memiliki jalur pengembangan yang lebih beragam. Li Dahai, salah satu pendiri dan CEO Face Wall Intelligence, juga menekankan pentingnya model industri, yang kini telah menjadi salah satu tren penting dalam pembangunan.

Jika Anda ingin memberdayakan ribuan industri secara lebih efektif, model besar dan daya komputasi terkait tidak dapat diterapkan hanya di cloud. Model edge dan end-side memiliki keunggulan komparatif yang tidak dimiliki cloud. Yang pertama adalah model sisi akhir memiliki keandalan yang lebih kuat. Model yang diterapkan pada terminal dapat berinteraksi dengan lingkungan secara real time dan terus menerus, namun sulit bagi model cloud untuk mempertahankan kesinambungan ini. Kedua, model sisi klien dapat lebih menjamin privasi pengguna. Masalah ini semakin menarik perhatian orang. Jika robot memasuki rumah secara luas di masa depan, masalah privasi akan menjadi lebih serius. Keuntungan model sisi klien dalam memastikan privasi data bahkan lebih jelas lagi.



Berdasarkan pemahaman ini, beberapa perusahaan komputasi edge telah memimpin dalam melaksanakan praktik skenario seputar edge AI dan telah berhasil menyuntikkan edge AI ke berbagai bidang. Misalnya, di bidang manufaktur cerdas, platform komputasi tepi Jetson milik NVIDIA dapat menghadirkan kemampuan komputasi inferensi AI ke dalam skenario industri dan memecahkan masalah seperti deteksi cacat dan manufaktur fleksibel di jalur perakitan dengan menggunakan penalaran visual AI yang dipercepat GPU. Solusi Intel juga digunakan di berbagai bidang seperti pemantauan cerdas, pendidikan dan pengajaran, serta perawatan medis cerdas. Melalui pengelolaan berbagai perangkat edge, solusi tersebut membantu layanan intelijen edge menjadi lebih fleksibel, efisien, dan akurat.

Perkembangan model edge dan end-side juga telah mendorong pertumbuhan komputasi AI edge, dan daya komputasi terkait, chip, dan hubungan rantai industri lainnya telah mengantarkan gelombang pengembangan skala besar. Qiu Xiaoxin, pendiri dan ketua Aixin Yuanzhi, menunjukkan bahwa implementasi model besar dalam skala besar memerlukan integrasi erat antara cloud, edge, dan end pada tiga tingkat. Kunci dari kombinasi edge side dan end side terletak pada AI komputasi dan persepsi. Qiu Xiaoxin percaya bahwa chip pintar dan model besar multi-modal telah menjadi "kombinasi emas" di era kecerdasan buatan ketika model besar semakin banyak digunakan dalam aplikasi, lebih ekonomis, lebih efisien, dan lebih ramah lingkungan akan menjadi kata kuncinya chip pintar, dan dilengkapi AI Chip inferensi prosesor yang efisien akan menjadi pilihan yang lebih masuk akal untuk implementasi model besar, yang juga merupakan kunci untuk mempromosikan AI inklusif. STL Partners memperkirakan bahwa pada tahun 2030, potensi ukuran pasar komputasi edge global akan tumbuh hingga US$445 miliar, dengan tingkat pertumbuhan tahunan gabungan industri sebesar 48%.

Penerapan daya komputasi yang terdiversifikasi untuk mengatasi tantangan fragmentasi

Namun, penerapan model besar di sisi edge/end tidak dapat diselesaikan dalam semalam. Karena keterbatasan sumber daya komputasi pada perangkat edge dan keragaman kebutuhan sumber daya komputasi pada model besar, penerapan edge pertama-tama akan menghadapi tantangan dalam hal daya komputasi. Di satu sisi, produsen model perlu melakukan pemrosesan teknis seperti kompresi, pemangkasan, dan kuantifikasi pada model besar untuk mengurangi ukuran dan kompleksitas komputasi model sehingga dapat beradaptasi dengan persyaratan kinerja perangkat edge/end-side; di sisi lain, bagaimana meningkatkan basis daya komputasi. Penerapan fasilitas juga menjadi fokus.

Zhang Yu, chief technology officer Divisi Jaringan dan Edge Intel Tiongkok, menekankan bahwa ketika kecerdasan buatan memberdayakan ribuan industri, aplikasi yang berbeda memiliki tuntutan daya komputasi yang berbeda, dan jangkauannya sangat luas. Perangkat dengan persyaratan kinerja tinggi perlu dihosting oleh cluster daya komputasi, sementara satu atau beberapa perangkat dengan persyaratan daya komputasi rendah dapat digunakan. Yang Lei, direktur produk Arm Technology, juga mengatakan bahwa ketika menerapkan model AI sebesar itu pada terminal, mereka masih menghadapi berbagai tantangan seperti biaya, konsumsi daya, dan ekosistem perangkat lunak.



Menanggapi tren permintaan tersebut, pemasok infrastruktur daya komputasi seperti Inspur dan Lenovo telah membangun tata letak daya komputasi seputar "kecerdasan jaringan-cloud-end-edge" dalam beberapa tahun terakhir. Produknya mencakup gateway edge cerdas, server edge, pengontrol industri, komputer tertanam, dan perangkat keras lainnya untuk memenuhi kebutuhan daya komputasi di berbagai industri. Di sisi chip, integrasi CPU+GPU+NPU telah menjadi arah pengembangan prosesor untuk mengatasi daya komputasi AI yang lebih kompleks. Qualcomm meluncurkan unit pemrosesan saraf khusus terintegrasi Snapdragon X Elite yang mendukung puluhan miliar model tingkat parameter. Prosesor Intel Meteor Lake menggabungkan fungsi AI pada NPU dengan mesin komputasi di dalam prosesor untuk meningkatkan efisiensi energi PC yang menjalankan fungsi AI. Dalam hal chip AI dalam negeri, Aixin Yuanzhi juga baru-baru ini merilis "Prosesor AI Aixin Tongyuan". Kumpulan instruksi operator inti dan arsitektur mikro aliran data mengadopsi arsitektur mikro aliran data yang dapat diprogram, yang secara efektif dapat meningkatkan efisiensi energi dan daya komputasi. Kepadatan, cocok untuk pengembangan komputasi tepi dan bidang penalaran AI.

Permasalahan efisiensi energi di sisi edge merupakan hal yang menonjol, dan pengembangan yang ringan adalah kuncinya

Efisiensi energi juga merupakan isu utama yang harus dipertimbangkan dalam pengembangan model edge large. Faktanya, jika model besar ingin diterapkan secara efektif di sisi edge/end, dibandingkan dengan cloud, masalah efisiensi energi akan lebih menonjol. Sachin Katti, wakil presiden senior Intel dan manajer umum Divisi Jaringan dan Edge, mengatakan dalam sebuah wawancara dengan penulis bahwa ketika membahas daya komputasi, selain mengoptimalkan daya komputasi, ekologi perangkat lunak, dll., masalah utamanya adalah konsumsi daya, terutama ketika itu Ketika dikerahkan di tepi. Konsumsi energi peralatan yang diterapkan di edge mungkin sekitar 200W; konsumsi energi penerapan cloud mungkin 1k hingga 2kW, dan konsumsi energi rak satu lapis di pusat data mungkin mencapai 100kW. Jika konsumsi energi seluruh pusat data dijumlahkan, mungkin akan mencapai skala 50G hingga 100GW.

Perangkat edge sering kali memiliki daya komputasi dan memori yang terbatas, dan model yang besar memerlukan sumber daya yang signifikan untuk inferensi berperforma tinggi. ‌Oleh karena itu, ‌cara ‌mengoptimalkan pemanfaatan sumber daya dan mengurangi konsumsi energi sekaligus memastikan keakuratan model dan kecepatan respons telah menjadi isu utama. Menanggapi tren ini, produsen terkait telah mempromosikan kerangka pengembangan ringan dan pustaka akselerasi, seperti mesin penerapan model AI Ryzen yang dirilis oleh AMD, pustaka akselerasi inferensi OpenVINO Intel, pustaka akselerasi inferensi kinerja tinggi TensorRT NVIDIA, dll., dikombinasikan dengan target Kerangka kerja pengembangan yang ringan untuk terminal tertanam dan seluler (seperti PyTorch Mobile, ‌TensorFlow Lite, ‌Paddle Lite, dll.)‌ dapat mendorong penerapan kecerdasan buatan secara luas di perangkat seluler, ‌Internet of Things, dan skenario komputasi edge lainnya.



Selain itu, industri juga mulai mengadopsi teknologi pendingin cair secara luas sebagai sarana pendinginan server, dan secara bertahap digunakan di pusat data dan penerapan model besar. Dapat dipahami bahwa teknologi pendingin cair yang ada sudah dapat mendinginkan armada berkapasitas 100kW dan diharapkan dapat diperluas hingga 300kW di masa depan.

Menjelajahi aplikasi AI, siapa yang akan menjadi “bintang” di masa depan?

Ketika orang semakin menekankan kekuatan model besar dalam aplikasi industri, menemukan "adegan bintang" yang sesuai telah menjadi isu utama yang menentukan keberhasilan atau kegagalan industri. Saat ini, ponsel AI, PC AI, dan kendaraan otonom telah menjadi pasar aplikasi paling menjanjikan untuk model besar.

Riset terbaru dari firma riset pasar IDC menunjukkan bahwa pasar ponsel AI akan mencapai pengiriman 234,2 juta unit pada tahun 2024, meningkat 363,6% dari 50,5 juta unit yang dikirimkan pada tahun 2023, dan akan mencakup 19% dari keseluruhan smartphone. pasar tahun ini. Pada tahun 2028, pengiriman ponsel AI akan mencapai 912 juta unit pada tahun 2028, dengan tingkat pertumbuhan tahunan gabungan sebesar 78,4%. Anthony Scarsella, direktur penelitian Pelacakan Ponsel Kuartalan Seluruh Dunia IDC, mengatakan biaya akan tetap menjadi penghambat utama ketika ponsel AI dirilis, karena banyak chip dan NPU yang kuat harganya mahal dan sebagian besar dijual di pasar ultra-high-end. Namun, seiring berjalannya waktu dan persaingan yang semakin ketat, kami yakin komponen-komponen ini akan memasuki model kelas menengah dan lebih terjangkau.

PC AI berkembang lebih cepat dari perkiraan semula dan diperkirakan akan membawa gelombang pengganti ke industri PC global. Menurut perkiraan Canalys, tingkat penetrasi PC AI global akan meningkat dari 19% menjadi 71% dari tahun 2024 hingga 2028, dan pengiriman akan meningkat dari 51 juta unit menjadi 208 juta unit, dengan tingkat pertumbuhan tahunan gabungan sebesar 42,11%. Morgan Stanley memperkirakan bahwa PC AI akan menguasai 2% dari keseluruhan pasar PC tahun ini, dan akan meningkat menjadi 16% pada tahun depan, 28% pada tahun 2026, 48% pada tahun 2027, dan 64% pada tahun 2028.

Penggunaan model besar pada mobil masih dalam tahap awal. Namun, seiring dengan semakin mengakarnya konsep kecerdasan di hati masyarakat, sebagian besar orang telah sepakat bahwa mobil pada akhirnya akan menjadi "terminal bergerak yang berjalan". model AI besar di mobil juga akan "mengambil jalan ekspres". Ada dua arah utama untuk memasukkan model besar ke dalam mobil: yang pertama adalah memasuki area kokpit untuk mencapai interaksi manusia-komputer yang lebih cerdas; yang lainnya adalah bekerja sama dengan sistem mengemudi otonom untuk lebih meningkatkan solusi mengemudi yang cerdas. Zhang Chi, CTO Maichi Intelligent Technology Co., Ltd., mengatakan bahwa model besar mempercepat transisi mengemudi otonom dari jalan raya ke skenario perkotaan yang lebih kompleks, dan juga mendorong pembentukan persepsi ujung ke ujung dan integrasi kontrol. Liu Jianwei, salah satu pendiri dan wakil presiden Aixin Yuanzhi, mengatakan bahwa Aixin Yuanzhi meramalkan pecahnya Transformer pada tahun 2022 dan memimpin peluncuran chip yang dilengkapi dengan prosesor Aixin Tongyuan AI. Chip penggerak cerdas Aixin Yuanzhi, seperti M55H dan M76H, telah dipasang pada model terlaris saat ini.