berita

Beberapa akademisi dan pakar berbicara tentang kecerdasan buatan: Tiongkok tidak dapat mengembangkan AI dengan "menumpuk chip"

2024-07-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

[Reporter Global Times Ma Jun] Amerika Serikat mengandalkan keunggulannya dalam perangkat lunak dan perangkat keras untuk menggunakan skalanya guna "menumpuk" kecerdasan buatan (AI) yang paling kuat di dunia. Miliarder Amerika, Musk, baru-baru ini mengumumkan di media sosial bahwa perusahaan rintisan AI miliknya, xAI, telah mulai menggunakan "Memphis Super Cluster" yang terdiri dari 100.000 GPU H100 untuk pelatihan AI, yang diklaim sebagai "klaster pelatihan AI paling kuat di dunia". Haruskah Tiongkok mengikuti jalur teknologi yang dipimpin oleh Amerika Serikat? Baru-baru ini, pada Seminar Pakar Pengembangan Daya Komputasi Tiongkok 2024 yang disponsori bersama oleh Aliansi Industri Komputasi Cerdas Tiongkok dan Kelompok Kerja Standar Daya Komputasi Komite Suar Nasional, sejumlah akademisi dan pakar memberikan pandangannya masing-masing.

Masa depan integrasi super-intelijen akan dibagi menjadi tiga tahap

Chen Runsheng, seorang akademisi dari Akademi Ilmu Pengetahuan Tiongkok, mengatakan pada seminar tersebut, "Model kecerdasan buatan yang besar merupakan representasi dari produktivitas baru. Pengembangan terintegrasi dari model besar dan superkomputer sangatlah penting. Negara kita perlu merancang dan mempertimbangkannya dengan serius. ." Peneliti Institut Teknologi Komputasi, Akademi Ilmu Pengetahuan Tiongkok Zhang Yunquan menyebutkan bahwa perkembangan pesat model besar menunjukkan karakteristik produktivitas baru, tetapi saat ini model tersebut juga menghadapi hambatan daya komputasi. Mengingat akumulasi teknologi Tiongkok yang sangat besar di bidang superkomputer, diharapkan fusi super cerdas (perpaduan superkomputer dan komputasi cerdas yang diwakili oleh model besar) dapat mengatasi tantangan ini secara efektif. Shan Zhiguang, direktur Departemen Informasi dan Pengembangan Industri di Pusat Informasi Nasional, menjelaskan, “Fusi super-cerdas lahir dengan perkembangan terdiversifikasi saat ini dari daya komputasi dasar, daya komputasi cerdas, daya komputasi super, dll., yaitu, apakah dapat menggunakan sumber daya komputasi hibrid atau sistem komputasi terintegrasi untuk memenuhi kebutuhan aplikasi berbagai sumber daya komputasi yang berbeda secara bersamaan.”

Ketika memperkirakan proses integrasi super-kecerdasan di masa depan, Qian Depei, seorang akademisi dari Chinese Academy of Sciences, percaya bahwa proses tersebut jelas akan berkembang melalui tiga tahap yaitu untuk AI, melalui AI dan menjadi AI, yang berkembang secara menyeluruh. dari perangkat keras hingga perangkat lunak untuk beradaptasi dan mempromosikan perkembangan teknologi. Pada fase pertama AI, fokusnya adalah pada transformasi dan peningkatan sistem komputer yang ada serta pengembangan perangkat keras khusus untuk memastikan bahwa tugas-tugas AI dapat didukung dan dijalankan secara efisien, dan untuk menyediakan infrastruktur yang kuat untuk penelitian kecerdasan buatan. Pada tahap kedua oleh AI, AI akan digunakan untuk mengubah komputasi tradisional. Di satu sisi, metode AI digunakan untuk memecahkan masalah superkomputer tradisional. Di sisi lain, AI juga akan mempengaruhi struktur komputer tradisional menjadi jelas. Pada tahap akhir menjadi AI, sistem komputer akan menunjukkan karakteristik kecerdasan yang melekat. Kecerdasan buatan tidak lagi merupakan kemampuan eksternal, tetapi telah menjadi atribut inti dan komponen dasar komputer kecerdasan akan jauh berbeda. Ini melebihi superkomputer atau komputasi cerdas yang kita miliki saat ini.

Chen Runsheng memperhatikan bahwa komunitas ilmiah dan industri telah berusaha memecahkan masalah integrasi superkomputer dan komputasi cerdas. Misalnya, arsitektur GB200 terbaru Nvidia sebenarnya adalah dua GPU ditambah satu CPU. Dalam arti tertentu, ini dapat dianggap memanfaatkan komputasi cerdas dan superkomputer transmisi data. Namun dia yakin bahwa arsitektur ini tidak menyelesaikan masalah efisiensi secara mendasar. “Kombinasi superkomputer dan komputasi cerdas tidak bisa dihindari dan akan terintegrasi secara organik, bukan sekadar disatukan.”

Zheng Weimin, seorang akademisi dari Chinese Academy of Engineering, juga mengatakan bahwa semua aspek pengembangan, pelatihan, penyempurnaan, dan inferensi model besar tidak dapat dipisahkan dari daya komputasi, dan biaya daya komputasi menyumbang sebagian besar dari keseluruhan pengeluaran, terutama pada tahap pelatihan, yang mencapai 70%. Pada tahap penalaran, mencapai 95%. Mengingat hal ini, daya komputasi telah menjadi faktor kunci yang mendukung pengembangan model besar.

Komputasi cerdas harus mengacu pada "kecerdasan manusia"

Akademisi dan pakar Tiongkok telah mengemukakan pandangan mereka sendiri mengenai kegilaan model skala besar Tiongkok saat ini dan jalur teknologi yang mengikuti “skala reaktor” Amerika Serikat. Qian Depei mengatakan bahwa Tiongkok sekarang memiliki model yang lebih besar dalam jumlah dan jenis dibandingkan Amerika Serikat, dan mereka juga terlibat dalam kecerdasan buatan secara umum. Namun, kami tidak hanya dibatasi secara ketat oleh Amerika Serikat dalam hal perangkat keras, tetapi juga kualitas data yang digunakan untuk pelatihan model besar. Baik model maupun kuantitasnya relatif kecil. "Apakah model besar yang diproduksi dengan cara ini bisa lebih baik dari model Amerika Serikat? Saya rasa kita masih harus menyesuaikan dengan kondisi nasional Tiongkok dan tidak bisa sepenuhnya ikuti orang Amerika."

Chen Runsheng juga percaya bahwa model besar yang saat ini muncul di Tiongkok pada dasarnya merupakan perbaikan dari model dan algoritma besar yang diusulkan oleh Amerika Serikat, namun hanya ada sedikit pertimbangan tentang teori dasar dari keseluruhan model besar. Dia menunjukkan pada seminar bahwa dibandingkan dengan model memori lokal yang digunakan oleh superkomputer tradisional, komputasi cerdas menunjukkan perbedaan mendasar – penyimpanan informasi terdistribusi.Metode penyimpanan ini meniru otak manusiaJaringan Syaraf Struktur kompleks membawa model yang semakin besar melalui jaringan chip berskala besar dan saling berhubungan secara padat. Namun, bagaimana cara memasukkan pengetahuan manusia secara efektif ke dalam sistem yang kompleks ini, dan bagaimana informasi didistribusikan dan disimpan dalam sistem, algoritma dan teori teknis di baliknya belum sepenuhnya dieksplorasi. "Dengan perluasan skala model yang tidak terkendali, masalah yang tidak dapat diatasi adalah konsumsi energi. Oleh karena itu, tidak disarankan untuk menambahkan chip secara membabi buta dan mengandalkan peningkatan kompleksitas sistem untuk memecahkan masalah penyimpanan model besar."

Oleh karena itu, Chen Runsheng berpendapat bahwa komputasi cerdas di masa depan harus tetap mengacu pada "kecerdasan manusia", yaitu mensimulasikan mekanisme operasi otak manusia. Otak manusia sangat kecil dan hanya mengonsumsi energi sebesar puluhan watt, namun kecerdasan yang dihasilkannya melebihi AI tercanggih saat ini, yang mengonsumsi energi sebanyak seluruh kota. “Pengembangan model besar dan komputasi cerdas tidak hanya memerlukan perbaikan model dan algoritma di tingkat aplikasi, tetapi juga memerlukan terobosan dari perspektif teori dasar. Saat ini, model besar baru mengembangkan 10% pertama, dan 90% dari pengembangan model besar dan komputasi cerdas. pekerjaan belum selesai. Saya juga percaya bahwa model besar pasti tidak dapat dicapai dengan menumpuk lebih banyak chip. Mereka harus belajar seperti otak manusia, mengompresi kompleksitas ruang dan waktu menjadi lebih kecil, dan mengurangi konsumsi energi menurut saya ini yang paling mendasar. Masalahnya adalah mempelajari kompleksitas ruang saat ini untuk melengkapi teori dasar komputasi cerdas. Jika kita dapat membuat beberapa kemajuan dalam teori dasar, kita dapat mencapai inovasi mendasar dan orisinal."

Yuan Guoxing, seorang peneliti di Institut Fisika Terapan dan Matematika Komputasi Beijing, percaya bahwa tidak mungkin mengharapkan model umum yang besar mampu memecahkan masalah di semua lapisan masyarakat. Dari situasi sebenarnya, aplikasi yang berbeda memiliki teknologi yang berbeda, memerlukan algoritma yang berbeda, dan memiliki kebutuhan daya komputasi yang berbeda. Misalnya, dalam komputasi ilmiah, persyaratan keakuratan perhitungan semakin tinggi seiring dengan meluasnya skala komputer, semakin banyak data, dan kredibilitasnya terus menurun. NASA (NASA ) juga mengemukakan sudut pandang serupa, dan mereka mengajukan persyaratan yang sangat tinggi untuk akurasi perhitungan. Oleh karena itu, aplikasi yang berbeda di masa depan akan memiliki model besar yang berbeda dan perhitungan yang berbeda untuk menyelesaikan masalah yang berbeda. Model besar saat ini memiliki persyaratan yang sangat berbeda untuk akurasi perhitungan dan algoritma.

Akademi Teknologi Informasi dan Komunikasi Chinakomputasi awanHe Baohong, direktur Big Data Research Institute, menambahkan: "Komputasi dan pelatihan memiliki persyaratan berbeda untuk infrastruktur yang mendasarinya, dan penting juga untuk menentukan dalam skenario apa perbedaan tersebut harus dilindungi dan dalam skenario apa perbedaan tersebut harus tercermin. "

Perlu mengembangkan model besar di tingkat negara

Zhang Yunquan mengatakan bahwa Amerika Serikat baru-baru ini mencoba "menjebak" negaranya dalam pengembangan kecerdasan buatan melalui serangkaian tindakan, termasuk melarang penjualan GPU kelas atas, menghentikan pembagian kode sumber untuk model besar, dan mengganggu kerjasama ekologi. Pada saat yang sama, ketika skala komputasi model besar kini mencapai 10.000 GPU, atau bahkan 100.000 GPU, superkomputer khusus untuk model besar perlu dikembangkan untuk menerobos hambatan teknis seperti dinding konsumsi energi, dinding keandalan, dan dinding paralel. Dalam konteks ini, jika Tiongkok ingin mendobrak hambatan daya komputasi pada model-model besar dalam jangka pendek, Tiongkok mempunyai cara untuk melakukannya: dengan menggunakan teknologi superkomputer canggih yang terakumulasi selama dua dekade terakhir untuk mengembangkan superkomputer khusus untuk model-model besar guna mengatasi hambatan tersebut. hambatan daya komputasi pada model-model besar, sehingga negara kita dapat dengan kuat menguasai model-model besar global tingkat paling maju dan tidak ketinggalan.

Saat memperkenalkan rencana "Model Besar Berdaulat" di bawah sistem fusi super cerdas, Zhang Yunquan mengatakan bahwa negara kita memiliki akumulasi teknologi yang besar di bidang superkomputer. Dalam beberapa tahun terakhir, negara ini telah menginvestasikan sejumlah besar uang dalam pengembangan komputasi cerdas kekuatan, dengan fokus pada pembentukan sistem daya komputasi fusi super cerdas sebagai pusatnya. Rekayasa sistem menanggapi kebutuhan daya komputasi model besar, dengan harapan dapat memaksimalkan penggunaan keunggulan teknologi superkomputer untuk memecahkan tantangan daya komputasi.Menurut penerapan rencana "Model Besar Tingkat Berdaulat", konsorsium inovasi "Model Besar Tingkat Berdaulat" akan mengandalkan superkomputer nasional, tim profesor terkenal dari Akademi Ilmu Pengetahuan Tiongkok dan universitas-universitas utama nasional, perusahaan chip pintar, perusahaan solusi model besar, dll. untuk bersama-sama menciptakan hal serupaBuka AI Sebuah organisasi terbuka, "model besar tingkat negara" dikembangkan oleh organisasi sektor nirlaba, dan "model besar tingkat negara" diterapkan oleh organisasi sektor nirlaba. Ia berpendapat bahwa superkomputer adalah "senjata terpenting negara" dan perlu digunakan untuk mengatasi tantangan terbesar dan tersulit. Model besar tingkat kedaulatan merupakan model akar yang dapat mendukung pembangunan nasional, bukan model besar biasa. Super model tingkat nasional serupa juga mendapat perhatian besar dari negara lain. Misalnya, Microsoft di Amerika Serikat dan OpenAI telah mengumumkan rencana untuk menginvestasikan US$100 miliar pada superkomputer kecerdasan buatan baru dalam pengembangan model tingkat nasional.

Chen Runsheng percaya bahwa berdasarkan kondisi dasar Tiongkok saat ini dan tren perkembangan model-model besar yang tak terhindarkan, tidak realistis bagi kita untuk sepenuhnya mengikuti pendekatan Barat, dan akan sulit untuk mengejar ketertinggalan dalam jangka pendek. Oleh karena itu, menjadi lebih penting lagi untuk menemukan cara untuk mengembangkan model skala besar di tingkat negara.