berita

dialog di china computing power conference|akademisi liu yunjie: kekuatan komputasi dalam negeri harus menutupi kekurangannya melalui cluster gpu

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

era ai (kecerdasan buatan) juga merupakan era kekuatan komputasi. perusahaan teknologi dan operator telekomunikasi di dalam dan luar negeri telah "menggulung" 10.000 kartu atau bahkan lebih dari 10.000 kartu, namun permasalahan seperti kompatibilitas ekologis dan komputasi heterogen juga menjadi gunung yang harus didaki oleh industri.
pada tanggal 28 september, saat upacara pembukaan china computing power conference 2024, liu yunjie, seorang akademisi dari chinese academy of engineering, mengatakan dalam sebuah wawancara dengan beijing news shell finance dan media lain bahwa gpu endpoint domestik masih akan kalah bersaing. dengan luar negeri dalam waktu singkat. cara yang mungkin untuk mengatasi kekurangan ini adalah dengan membangun jaringan daya komputasi untuk "melatih seluruh daya komputasi" dan memberikan pengaruh penuh pada cluster gpu.
selain itu, ia menunjukkan bahwa tidak mungkin hanya menilai jenis perusahaan mana yang memiliki keunggulan lebih dalam membangun jaringan daya komputasi, tetapi terutama melalui evaluasi teknis. “itu tergantung apakah teknologi anda dapat digunakan dan dikembangkan, dan apakah inovasi anda dan jalur yang anda ambil memenuhi kebutuhan.” mengenai masalah biaya daya komputasi, ia tetap menekankan bahwa “harus diselesaikan dengan teknologi baru.”
saat ini, teknologi jaringan deterministik yang dipelajari oleh liu yunjie dapat menghemat 60% hingga 70% biaya. proyek penjadwalan jaringan komputasi yang diluncurkannya bersama dengan institusi lain dapat mencapai beberapa pelatihan di luar lokasi untuk mencapai efisiensi 80% dari jaringan tunggal. pelatihan titik.
liu yunjie, akademisi akademi teknik tiongkok. foto milik orang yang diwawancarai.
disarankan untuk mengambil jalur model industri besar untuk memecahkan masalah sirkulasi data dan pemanfaatan daya komputasi.
“tiongkok harus mengambil jalur model industri skala besar.” liu yunjie menekankan dalam pidato utamanya. ia yakin bahwa model-model besar untuk keperluan umum dalam negeri mungkin akan tertinggal jauh dibandingkan amerika serikat dalam jangka pendek, dan akan sulit untuk mengejar ketertinggalannya.
dia mengusulkan bahwa jika perusahaan model dalam negeri dapat melatih data industri dengan baik dan membuat model industri besar berdasarkan model umum yang besar, mereka “pasti dapat mengikuti jalur tiongkok.” ia optimis dengan arah teknis ini karena ia yakin bahwa "data industri tiongkok adalah yang terlengkap dan komprehensif."
pada saat yang sama, ia mengatakan, pengembangan model industri skala besar memerlukan upaya bersama antara pemerintah, badan usaha, dan permodalan. ia mengatakan kepada reporter dari shell finance bahwa saat ini, pembagian dan sirkulasi data dalam negeri masih perlu diperkuat, hal ini berdampak pada besarnya model industri pelatihan, dan "semua orang masih menjajaki" jenis jalur mana yang akan digunakan. lebih menjanjikan.
data yang diungkapkan pada china computing power conference 2024 menunjukkan total skala daya komputasi nasional mencapai 246 eflops. berdasarkan pantauan liu yunjie, daya komputasi dalam negeri telah mencapai skala tertentu, namun tingkat pemanfaatannya belum terlalu ideal.
“jika daya komputasi ingin melayani perekonomian riil, beberapa pihak harus setuju.” liu yunjie percaya bahwa pertama-tama, penyedia daya komputasi dan jaringan harus melakukan pekerjaan dengan baik, “(karena) mereka telah memperoleh manfaat melalui layanan ini.” selain itu, pemerintah juga harus mengatakan hal-hal yang baik, “(karena) pemerintah telah menyelesaikan masalah tersebut.” yang terakhir, perusahaan harus mengatakan dengan baik, "(karena) perusahaan telah meningkatkan efisiensi mereka sendiri dengan menggunakan daya komputasi dan internet."
ia menegaskan, efek "kesepakatan satu pihak" tidak bertahan lama, artinya industri belum membangun ekosistem daya komputasi. “jika kita tidak menyelesaikan masalah ekologi, kita tidak akan bisa memanfaatkannya (daya komputasi).”
jaringan deterministik adalah salah satu teknologi dasar jaringan daya komputasi masa depan, yang akan menghemat 60%-70% biaya.
“pelatihan model besar memerlukan transmisi data lossless dan menerapkan persyaratan pada indikator jaringan seperti kehilangan paket, jitter, dan penundaan,” kata liu yunjie. dengan mengambil contoh standar data internasional, ia menjelaskan jika tingkat packet loss mencapai lima per seribu, maka efisiensi transmisi akan turun hingga 50%.
lebih lanjut dia menjelaskan bahwa ini seperti menggunakan seluruh bandwidth 100g untuk mengirimkan data, dan hanya bandwidth 50g yang berguna. “ketika turun menjadi 1%, efisiensinya kira-kira sama dengan 0, sehingga tidak mungkin untuk dilatih dan dinalar.”
protokol rdma (remote direct memory access) diperlukan jaringan untuk menghindari kehilangan paket. teknologi ini memungkinkan komputer untuk secara langsung mengakses memori komputer jarak jauh, mengirimkan data pada tingkat memori tanpa seringnya intervensi cpu, dan mengurangi penundaan pemrosesan dan konsumsi sumber daya pihak pengirim dan penerima selama proses transmisi data.
bagaimana cara memenuhi standar transmisi data untuk pelatihan dan inferensi model besar? liu yunjie percaya bahwa teknologi jaringan deterministik relatif memenuhi persyaratan, dan dia menilainya sebagai "teknologi dasar untuk jaringan daya komputasi masa depan". liu yunjie mengungkapkan, pada tahun 2022, ia memimpin tim untuk membuka jaringan deterministik di 35 kota. jumlah kota kini bertambah menjadi 39. dapat mencapai end-to-end delay dan jitter kurang dari 50 mikrodetik serta mencapai zero packet loss. .
dalam proses pengembangan teknologi jaringan deterministik, liu yunjie percaya bahwa terobosan teknologi terpenting adalah integrasi fotolistrik, yang membawa terobosan dalam pemanfaatan bandwidth, biaya jaringan, dan konsumsi energi.
dalam hal biaya, ia mengambil contoh perusahaan mengemudi otonom dan menjelaskan bahwa data mengemudi otonom yang dihasilkan oleh 20 kendaraan di 4 tempat di seluruh negeri setiap hari pertama-tama dikirim kembali ke shanghai dan kemudian ke guiyang untuk pelatihan, yang membutuhkan sekitar dua sirkuit 10g dan a 1g berharga sekitar 10 juta yuan per tahun.
apa yang harus saya lakukan jika saya tidak mampu membelinya? beralih menggunakan hard drive untuk mengumpulkan data dan memindahkannya antara dua kota, dengan memperhitungkan kehilangan data, kerusakan hard drive, dll., akan menelan biaya sekitar 1,9 juta yuan per tahun. dan menggunakan jaringan deterministik untuk menyediakan layanan melalui pemotongan, "120.000 yuan setahun sudah cukup."
liu yunjie menekankan bahwa tingkat pengurangan biaya ini dicapai melalui berbagi jaringan. data yang ia tunjukkan dalam pidato utamanya menunjukkan bahwa jaringan tersebut telah berjalan di jaringan pengujian selama lebih dari tiga bulan, dengan efisiensi parameter mencapai lebih dari 95% dan penghematan biaya 60% hingga 70%.
memanfaatkan sepenuhnya efek cluster gpu untuk menutupi kekurangan daya komputasi domestik
apakah jaringan daya komputasi kemungkinan akan menjadi arah di mana daya komputasi dalam negeri melampaui daya komputasi asing di masa depan? liu yunjie berkata bahwa pemahaman yang lebih akurat adalah "mengkompensasi kekurangan". ia yakin dalam waktu dekat, gpu endpoint kami masih kalah bersaing dengan negara asing. “saya mungkin tidak bisa menandingi anda dalam satu aspek, tapi saya bisa mengalahkan anda dengan memanfaatkan kekuatan grup.” dia lebih lanjut menekankan bahwa untuk menggunakan efek cluster gpu, perlu membangun jaringan untuk “melatih seluruh kekuatan komputasi.”
ia percaya bahwa model besar dapat mengadopsi jalur pelatihan kolaboratif dan pelatihan terdistribusi. "jika 100.000 kartu dilatih di satu tempat, kekuatannya akan terlalu besar." ia mengungkapkan bahwa timnya bersama-sama meluncurkan program tersebut dengan chinese academy of sciences, pusat superkomputer wuxi nasional dan lembaga lainnya. proyek penjadwalan jaringan daya komputasi nasional dapat mencapai efek penyelesaian masalah antrian pada tingkat menit, dan beberapa pelatihan di luar lokasi dapat mencapai efisiensi 80% dari pelatihan satu titik. “pada dasarnya, pelatihan terdistribusi dan pelatihan kolaboratif dapat dilakukan.”
ketika berbicara tentang bagaimana mengoordinasikan hubungan pengembangan antara perangkat keras dan perangkat lunak komputasi, liu yunjie mengusulkan agar perangkat lunak dan perangkat keras harus digabungkan dan diintegrasikan untuk pengembangan.
produksi perangkat keras menghabiskan sumber daya geofisika, katanya. “(setiap kali) mengkonsumsi sedikit, sumber dayanya sedikit berkurang.” perangkat lunak relatif fleksibel, dapat dimodifikasi, dan mengkonsumsi lebih sedikit sumber daya fisik. “ini adalah konsep pembangunan sosial yang sangat penting.” selain itu, liu yunjie percaya bahwa pengembangan perangkat lunak menghabiskan sejumlah sumber daya manusia, namun setelah penerapan ai, efisiensi pengembangan telah dipercepat. ia kemudian mengusulkan agar seluruh bagian yang dapat digantikan oleh perangkat lunak harus dikembangkan semaksimal mungkin.
“tetapi perangkat lunak tidak mahakuasa dan harus memenuhi kondisi perangkat keras yang dibutuhkan oleh daya komputasi.” dia percaya bahwa bagian-bagian yang tidak dapat ditanggung oleh perangkat lunak harus dikembangkan bersama dengan perangkat keras.
bagaimana cara menciptakan ekosistem jaringan daya komputasi bersama? liu yunjie menyarankan agar departemen pemerintah terkait harus mengoordinasikan dan mengelolanya, dan perusahaan serta lembaga penelitian ilmiah harus bekerja sama secara erat. "ini adalah proyek keseluruhan, tapi saat ini semua orang mengerjakannya sendiri-sendiri."
reporter beijing news shell finance, wei yingzi
editor lin zi
dikoreksi oleh liu jun
laporan/umpan balik