Siapa yang merencanakan chip pusat komputasi pintar?

2024-08-05

Teks: Perspektif Industri Semikonduktor

Industri terkait "kekuatan komputasi" terus berkembang pesat akhir-akhir ini, dan pembangunan pusat komputasi cerdas juga berkembang pesat di mana-mana.

Memasuki tahun 2024, Wuchang Intelligent Computing Center, China Mobile Intelligent Computing Center (Qingdao), South China Data Valley Intelligent Computing Center, Zhengzhou Artificial Intelligence Computing Center, Broad Data Shenzhen Qianhai Intelligent Computing Center, dll. telah mulai dibangun atau dimasukkan ke dalam produksi.

Menurut statistik yang tidak lengkap, saat ini terdapat lebih dari 30 kota di seluruh negeri yang sedang membangun atau mengusulkan pembangunan pusat komputasi cerdas, dengan skala investasi melebihi 10 miliar yuan.

Apa sebenarnya pusat komputasi cerdas itu? Untuk apa pusat komputasi cerdas terutama digunakan? Apa karakteristik pusat komputasi cerdas?

Apa itu pusat komputasi cerdas?

Menurut definisi "Rencana Aksi untuk Pengembangan Infrastruktur Komputasi Berkualitas Tinggi", pusat komputasi cerdas mengacu pada penggunaan sumber daya komputasi heterogen berskala besar, termasuk daya komputasi umum (CPU) dan daya komputasi cerdas (GPU, FPGA, ASIC, dll.), terutama Fasilitas yang menyediakan daya komputasi, data, dan algoritme yang diperlukan untuk aplikasi kecerdasan buatan (seperti pengembangan model pembelajaran mendalam kecerdasan buatan, pelatihan model, inferensi model, dan skenario lainnya).

Dapat juga dikatakan bahwa pusat komputasi cerdas adalah pusat data yang berfokus pada tugas-tugas komputasi kecerdasan buatan.

Pusat data biasanya mencakup tiga kategori. Selain pusat komputasi cerdas, dua lainnya adalah pusat komputasi umum yang berfokus pada tugas komputasi umum, dan pusat superkomputer yang berfokus pada tugas superkomputer.

Tahun 2023 merupakan tahun titik balik yang penting bagi pengembangan kecerdasan buatan. Teknologi AIGC telah mencapai kemajuan yang pesat. Bisnis-bisnis baru seperti pelatihan model besar dan aplikasi model besar bermunculan dengan pesat ruang komputer hingga pusat komputasi umum, dikembangkan ke tahap saat ini dari pusat superkomputer dan pusat komputasi cerdas.

Apa perbedaan antara pusat komputasi cerdas dan pusat data umum?

Pusat komputasi cerdas, biasanya terkait erat dengan komputasi awan, menekankan fleksibilitas pengendalian sumber daya dan manajemen infrastruktur. Dalam lingkungan cloud, penyedia pusat data bertanggung jawab atas pemeliharaan perangkat keras dan perangkat lunak tertentu, sedangkan pelanggan memiliki datanya. Sebaliknya, pusat data lokal tradisional mengharuskan perusahaan untuk mengelola dan memelihara semua sumber daya datanya sendiri.

Perbedaan mendasar ini menyebabkan perbedaan besar antara kedua model dalam hal investasi modal, penyebaran sumber daya, dan keamanan.

Dalam hal investasi modal, pelanggan pusat komputasi cerdas dapat memilih model layanan yang sesuai untuk mereka, seperti cloud publik, cloud pribadi, atau cloud hybrid, tanpa biaya perangkat keras dan perangkat lunak yang besar; sementara pelanggan pusat data tradisional perlu menginvestasikan banyak uang untuk membeli dan memelihara server, jaringan, dan peralatan penyimpanan yang Anda perlukan.

Dalam hal penyebaran sumber daya dan keamanan, pelanggan pusat komputasi cerdas dapat mengakses dan mengelola data dan aplikasi mereka dari jarak jauh melalui Internet kapan saja dan di mana saja firewall, enkripsi, Pencadangan dan pemulihan, dll.; sedangkan pelanggan pusat data tradisional dibatasi oleh kantor/lokasi yang ditentukan dan perlu melindungi dan mengelola data sendiri.

Pusat komputasi cerdas hanyalah pusat komputasi data yang secara khusus melayani kecerdasan buatan dan dapat menyediakan daya komputasi khusus yang diperlukan untuk penghitungan kecerdasan buatan. Dibandingkan dengan pusat data tradisional, pusat komputasi cerdas dapat memenuhi kebutuhan yang lebih bertarget, memiliki volume komputasi yang lebih besar dan kecepatan komputasi yang lebih cepat, serta menyediakan komputasi AI untuk berbagai skenario industri vertikal seperti inferensi pelatihan model besar, mengemudi otonom, dan kekuatan AIGC.

Jenis chip apa yang dibutuhkan untuk komputasi cerdas AI?

Dalam hal pemilihan perangkat keras, arsitektur perangkat keras pusat komputasi cerdas juga berbeda dengan pusat data tradisional.

Jenis chip komputasi apa yang diperlukan untuk komputasi cerdas AI?

Arsitektur perangkat keras pusat data tradisional relatif sederhana, terutama mencakup server, perangkat penyimpanan, dan perangkat jaringan. Dibandingkan dengan arsitektur perangkat keras ini, pusat komputasi cerdas akan lebih fleksibel, dan node komputasi yang berbeda akan dipilih untuk skenario aplikasi yang berbeda.

Server komputasi cerdas adalah perangkat keras komputasi utama dari pusat komputasi cerdas. Biasanya server ini mengadopsi arsitektur komputasi heterogen "CPU+GPU", "CPU+NPU", atau "CPU+TPU" untuk memberikan pengaruh penuh pada kinerja, biaya, dan kinerja chip komputasi yang berbeda.

GPU, NPU, dan TPU memiliki jumlah inti yang banyak dan bagus dalam komputasi paralel. Algoritme AI melibatkan sejumlah besar tugas operasi matriks sederhana dan memerlukan kemampuan komputasi paralel yang kuat.

Server tujuan umum tradisional menggunakan CPU sebagai chip utama untuk mendukung komputasi tujuan umum dasar seperti komputasi awan dan komputasi tepi.

Jenis chip memori apa yang diperlukan untuk komputasi cerdas AI?

Tidak hanya chip daya komputasi yang berbeda, komputasi cerdas AI juga memiliki persyaratan yang lebih tinggi untuk chip memori.

Yang pertama adalah dosis. Kapasitas DRAM server komputasi cerdas biasanya 8 kali lipat dari server biasa, dan kapasitas NAND 3 kali lipat dari server biasa. Bahkan papan sirkuit PCB-nya memiliki lebih banyak lapisan dibandingkan server tradisional.

Ini juga berarti bahwa server komputasi cerdas perlu menggunakan lebih banyak chip memori untuk mencapai kinerja yang diperlukan.

Seiring dengan meningkatnya permintaan, serangkaian masalah hambatan juga muncul.

Di satu sisi, arsitektur von Neumann tradisional mengharuskan data harus dimuat ke dalam memori, sehingga menghasilkan efisiensi pemrosesan data yang rendah, latensi tinggi, dan konsumsi daya yang tinggi; di sisi lain, masalah dinding memori menyebabkan kinerja prosesor tumbuh lebih cepat daripada kecepatan memori. Akibatnya, sejumlah besar data perlu ditransfer antara SSD dan memori; selain itu, keterbatasan kapasitas dan bandwidth SSD yang dipasang pada CPU juga menjadi penghambat kinerja.

Menghadapi masalah seperti "dinding penyimpanan" dan "dinding konsumsi daya", arsitektur penyimpanan komputasi dalam arsitektur komputasi tradisional perlu segera ditingkatkan. Hanya dengan mengintegrasikan penyimpanan dan komputasi secara organik, arsitektur tersebut dapat menandingi sejumlah besar data di era komputasi cerdas dengan potensi peningkatan efisiensi energi yang besar.

Menanggapi rangkaian masalah ini, penyimpanan terintegrasi dan chip kalkulasi mungkin merupakan jawaban yang baik.

Selain chip yang berbeda, untuk memberikan performa penuh dan memastikan pengoperasian yang stabil, server AI juga telah dirancang dengan arsitektur yang ditingkatkan, pembuangan panas, topologi, dan aspek lainnya.

Siapa yang mengeluarkan chip ini?

Tata letak chip daya komputasi

Di sisi GPU, GPU bagus dalam komputasi paralel besar-besaran. Huawei, Tianshu Zhixin, Moore Thread, Sugon, Suiyuan Technology, Nvidia, Intel, AMD, dll. semuanya telah meluncurkan chip terkait. Misalnya, Huawei telah meluncurkan seri chip AI Ascend, Ascend 910 dan Ascend 310. Chip ini dirancang khusus untuk pelatihan dan penalaran AI, serta memiliki performa tinggi dan konsumsi daya rendah. Seri Ascend telah banyak digunakan di pusat data, layanan cloud, komputasi edge, dan bidang lainnya, memberikan dukungan daya komputasi yang kuat untuk pusat komputasi cerdas.

NVIDIA telah meluncurkan sejumlah produk GPU untuk pelatihan dan inferensi AI, seperti A100, H100, dll. Intel juga telah meluncurkan sejumlah produk chip AI, seperti chip seri Gaudi Habana Labs, yang bertujuan untuk bersaing dengan Nvidia. AMD juga telah membuat rencana di bidang chip AI dan meluncurkan produk GPU dan APU seri MI.

Dalam hal FPGA, CPU+FPGA menggabungkan fleksibilitas dan kinerja tinggi untuk beradaptasi dengan perubahan algoritma yang cepat. Xilinx dan Intel adalah pemain utama di pasar. Produk terkait meliputi: seri produk VIRTEX, KINTEX, ARTIX, SPARTAN Xilinx dan seri produk utama Intel Agilex termasuk Fudan Microelectronics, Unisoc Microelectronics, dan Anlu Technology wait.

Dalam hal ASIC, CPU+ASIC menyediakan komputasi berkinerja tinggi yang disesuaikan untuk memenuhi kebutuhan spesifik. Raksasa asing seperti Google, Intel, dan NVIDIA berturut-turut merilis chip ASIC. Pabrikan dalam negeri seperti Cambrian, Huawei HiSilicon, dan Horizon juga telah meluncurkan chip ASIC yang dipercepat oleh jaringan saraf dalam.

Dalam hal NPU, NPU adalah prosesor yang dirancang khusus untuk skenario kecerdasan buatan dan pembelajaran mesin. Berbeda dari CPU dan GPU, NPU telah dioptimalkan secara khusus dalam struktur perangkat keras dan berfokus pada pelaksanaan tugas komputasi terkait AI seperti inferensi jaringan saraf. Kombinasi keserbagunaan CPU dan kekhususan NPU memungkinkan seluruh sistem merespons secara fleksibel berbagai skenario aplikasi AI dan dengan cepat beradaptasi terhadap perubahan algoritma dan model.

Saat ini terdapat banyak NPU atau chip yang diproduksi secara massal yang dilengkapi dengan modul NPU di pasaran. Yang terkenal antara lain NPU Qualcomm Hexagon dan seri Ascend dari Huawei. Perlu dicatat bahwa semua produsen besar memiliki desain unik dalam desain inti komputasi chip .Strategi.

Dalam hal TPU, TPU adalah chip yang dikembangkan oleh Google khusus untuk mempercepat kekuatan komputasi jaringan saraf dalam. Ini lebih fokus pada pemrosesan tugas pembelajaran mendalam berskala besar dan memiliki daya komputasi yang lebih tinggi dan latensi yang lebih rendah. TPU juga merupakan chip ASIC.

Dalam hal DPU, DPU dirancang khusus untuk tugas pemrosesan data dan memiliki struktur perangkat keras yang sangat optimal yang cocok untuk kebutuhan komputasi di bidang tertentu. Berbeda dengan CPU yang digunakan untuk komputasi umum dan GPU yang digunakan untuk akselerasi komputasi, DPU merupakan chip utama ketiga di pusat data. Produk DPU dari tiga raksasa internasional NVIDIA, Broadcom, dan Intel menempati sebagian besar pasar domestik. Banyak produsen seperti Xilinx, Marvell, Pensando, Fungible, Amazon, dan Microsoft juga telah memproduksi DPU atau produk arsitektur serupa dalam 2 tahun terakhir. 5 tahun. . Produsen dalam negeri termasuk Zhongke Yushu, Xinqiyuan, Yunbao Intelligence, Dayu Zhixin, Alibaba Cloud, dll.

Kemana perginya chip komputasi dalam negeri?

Pada Konferensi Jaringan Komputasi Seluler Beijing 2024, simpul China Mobile Computing Center di Beijing secara resmi mulai digunakan, menandai tahap baru dalam pembangunan pusat komputasi cerdas di negara saya. Sebagai pusat komputasi cerdas terintegrasi pelatihan dan promosi berskala besar pertama di Beijing, proyek ini mencakup area seluas sekitar 57.000 meter persegi, menerapkan hampir 4.000 kartu akselerator AI, memiliki tingkat lokalisasi 33% chip AI, dan memiliki komputasi cerdas skala kekuatan lebih dari 1.000P.

Zhen Yanan, CTO Beijing Beilong Super Cloud Computing Co., Ltd., entitas pengoperasian Beijing Super Cloud Computing Center, baru-baru ini mengatakan bahwa mereka saat ini sedang "mencangkok" model besar domestik dengan chip domestik, dan itu hanya membutuhkan waktu sekitar 15 hari untuk melewatinya. Ia percaya bahwa pembagian daya komputasi akan menjadi tren utama di industri, dan sumber daya komputasi GPU kelas atas memerlukan upaya semua pihak.

Dalam beberapa tahun terakhir, struktur pasar chip daya komputasi kecerdasan buatan Tiongkok sebagian besar didominasi oleh NVIDIA, yang menguasai lebih dari 80% pangsa pasar.

Zhen Yanan berkata, "Kami juga sangat prihatin dengan pengembangan chip dalam negeri. Dapat dipahami bahwa model besar yang dikembangkan sendiri di dalam negeri dan bahkan beberapa model besar open source terus-menerus ditransplantasikan ke chip dalam negeri. Sekarang dari perspektif penggunaan chip, beberapa model yang dimilikinya dapat dijalankan, dan yang perlu dikejar terutama adalah performa tinggi seperti GPU.

"Seluruh lokalisasi bersifat hierarkis. Chip termasuk dalam lapisan perangkat keras. Selain itu, ada ekosistem perangkat lunak. Untuk chip dalam negeri, baik kerangka maupun ekosistemnya memerlukan siklus budidaya tertentu." kepercayaan yang cukup pada chip domestik.

Tata letak chip memori

Pusat komputasi cerdas harus memiliki kapasitas tinggi, keandalan tinggi, ketersediaan tinggi, dan karakteristik lain dalam hal penyimpanan. Perangkat penyimpanan biasanya menggunakan hard drive atau solid-state drive berkinerja tinggi dan dilengkapi dengan arsitektur penyimpanan redundan untuk memastikan keamanan dan aksesibilitas data. Samsung, Micron, SK Hynix, dll. memiliki chip terkait yang banyak digunakan di pusat data, komputasi awan, dan bidang lainnya untuk menyediakan solusi penyimpanan berkinerja tinggi untuk pusat komputasi cerdas.

Pabrikan dalam negeri juga telah mencapai perkembangan pesat dalam mengejar teknologi DRAM dan NAND dalam beberapa tahun terakhir.

Selain chip memori tradisional, pusat komputasi cerdas juga memerlukan chip terintegrasi penyimpanan-penyimpanan-komputasi baru yang disebutkan di atas untuk memainkan peran yang lebih besar.

Dilihat dari sejarah perkembangan penyimpanan dan komputasi terintegrasi, sejak tahun 2017, produsen besar seperti NVIDIA, Microsoft, dan Samsung telah mengusulkan prototipe penyimpanan dan komputasi terintegrasi. Pada tahun yang sama, perusahaan penyimpanan dan komputasi terintegrasi dalam negeri mulai bermunculan.

Permintaan pabrikan besar terhadap arsitektur penyimpanan dan komputasi terintegrasi bersifat praktis dan cepat untuk diterapkan. Sebagai teknologi yang paling dekat dengan implementasi teknik, komputasi dekat memori telah menjadi pilihan pertama pabrikan besar. Pabrikan besar dengan ekosistem yang kaya seperti Tesla dan Samsung, serta produsen chip tradisional seperti Intel dan IBM, semuanya menerapkan komputasi dekat memori.

Perusahaan rintisan dalam negeri berfokus pada komputasi dalam memori yang tidak memerlukan teknologi proses canggih. Di antara mereka, startup seperti Zhicun Technology, Yizhu Technology, dan Jiutian Ruixin semuanya bertaruh pada PIM, CIM, dan rute teknologi lainnya yang mengintegrasikan penyimpanan dan komputasi lebih dekat dengan "penyimpanan" dan "komputasi". Teknologi Yizhu, Teknologi Qianxin, dll. fokus pada skenario daya komputasi besar AI seperti perhitungan model besar dan mengemudi otonom; Shanyi, Teknologi Xinyi, Teknologi Pingxin, Teknologi Zhicun, dll. fokus pada Internet of Things, perangkat yang dapat dikenakan, dan rumah pintar. . Skenario seperti daya komputasi marjinal.

Teknologi Yizhu berkomitmen untuk merancang chip AI berdaya tinggi menggunakan arsitektur penyimpanan dan komputasi terintegrasi. Untuk pertama kalinya, teknologi ini menggabungkan memristor ReRAM dengan arsitektur penyimpanan dan komputasi terintegrasi pada struktur industri saat ini. Chip daya komputasi AI yang besar dengan efektivitas biaya, rasio efisiensi energi yang lebih tinggi, dan ruang yang lebih besar untuk pengembangan daya komputasi telah mengambil jalur baru dalam pengembangan.

Teknologi Qianxin berfokus pada penelitian dan pengembangan penyimpanan daya komputasi besar dan chip komputasi terintegrasi komputasi serta solusi komputasi untuk bidang kecerdasan buatan dan komputasi ilmiah. Dibandingkan dengan perusahaan lain dalam hal throughput komputasi, chip AI tradisional dapat meningkatkan kinerja 10-40 kali lipat. Saat ini, penyimpanan yang dapat dikonfigurasi ulang dan chip terintegrasi komputasi (prototipe) telah dicoba atau diimplementasikan dalam komputasi awan, persepsi mengemudi otonom, klasifikasi gambar, pengenalan pelat nomor dan bidang lainnya juga memiliki penyimpanan daya komputasi yang besar dan prototipe produk chip terintegrasi komputasi menjadi yang pertama di Tiongkok yang lulus pengujian internal terhadap perusahaan Internet besar.

Rencana Teknologi Zhicun adalah mendesain ulang memori, menggunakan karakteristik fisik sel penyimpanan memori Flash, mengubah susunan penyimpanan dan mendesain ulang sirkuit periferal sehingga dapat menampung lebih banyak data, dan pada saat yang sama menyimpan operator ke dalam memori, sehingga masing-masing Setiap unit dapat melakukan operasi simulasi dan langsung mengeluarkan hasil operasi untuk mencapai tujuan mengintegrasikan penyimpanan dan perhitungan.

Komputasi cerdas mencakup lebih dari 30% skala tersebut, dan konstruksi daya komputasi sedang berjalan lancar

Pada awal Juli, Pusat Komputasi Barat Daya Intelijen Tianfu secara resmi dioperasikan di Chengdu, Sichuan. Menurut laporan, pusat tersebut akan menggunakan kekuatan komputasi untuk mendukung penciptaan industri inti kecerdasan buatan dengan tingkat 100 miliar di Chengdu dan memberdayakan inovasi kecerdasan buatan di berbagai bidang seperti industri manufaktur, ilmu pengetahuan alam, biomedis, dan eksperimen simulasi penelitian ilmiah.

Ini bukanlah kasus yang terisolasi. Dalam sebulan terakhir, proyek Pusat Komputasi Cerdas Ramah Lingkungan Yinchuan telah dimulai secara intensif; Beijing Mobile telah membangun pusat komputasi cerdas terintegrasi dan pelatihan skala besar pertama di Beijing untuk mendukung puluhan miliar dan ratusan miliar pelatihan dan penalaran model besar dengan kompleksitas tinggi dan persyaratan komputasi tinggi; Zhengzhou Pusat komputasi kecerdasan buatan telah memulai pembangunan, dengan total investasi lebih dari 1,6 miliar yuan... Infrastruktur digital baru yang diwakili oleh pusat komputasi cerdas sedang mempercepat pembangunan dan implementasinya.

Data yang dirilis oleh Biro Statistik Nasional pada tanggal 15 Juli menunjukkan bahwa pada akhir Mei, 460.000 stasiun pangkalan 5G telah dibangun di seluruh negeri; lebih dari 10 pusat komputasi cerdas dengan cluster komputer berkinerja tinggi telah direncanakan, dan kekuatan komputasi cerdas menyumbang lebih dari 30% dari total daya komputasi.

Menurut statistik yang tidak lengkap dari China IDC Circle, pada tanggal 23 Mei 2024, terdapat 283 pusat komputasi cerdas di daratan Tiongkok, yang mencakup seluruh provinsi, daerah otonom, dan kotamadya di Tiongkok daratan. Diantaranya, terdapat 140 proyek pusat komputasi cerdas dengan statistik investasi, dengan total investasi 436,434 miliar yuan. Terdapat 177 proyek pusat komputasi cerdas dengan statistik skala daya komputasi yang direncanakan, dan total skala daya komputasi mencapai 369.300 PFlops.

"Pusat komputasi cerdas" ini memiliki standar dan skala yang berbeda. Skala daya komputasi umumnya 50P, 100P, 500P, 1000P, dan bahkan ada yang mencapai lebih dari 12000P meskipun gelombang AI telah membawa prospek pengembangan yang luas ke pusat komputasi cerdas, pasokan dan permintaan Ketidaksesuaian, harga tinggi, dan duplikasi konstruksi masih menjadi permasalahan yang dihadapi oleh konstruksi tenaga komputasi di negara saya.

Pada saat yang sama, banyak negara juga telah memperkenalkan rencana khusus untuk memperjelas tujuan konstruksi dalam beberapa tahun ke depan dan meningkatkan langkah-langkah dukungan dalam hal teknologi, penerapan, dan pendanaan. Misalnya, Jiangsu mengeluarkan rencana khusus untuk pengembangan infrastruktur daya komputasi provinsi, yang mengusulkan bahwa pada tahun 2030, total daya komputasi yang digunakan di provinsi tersebut akan melebihi 50EFLOPS (EFLOPS mengacu pada 10 miliar operasi floating-point per detik), dan cerdas daya komputasi akan mencapai lebih dari 45%; Gansu mengusulkan untuk memberikan dukungan kebijakan untuk infrastruktur jaringan komputasi baru dalam hal penggunaan lahan, pembangunan fasilitas pendukung kota, pengenalan bakat, dan pendanaan.

“Perkembangan aplikasi yang eksplosif seperti model besar kecerdasan buatan telah menyebabkan lonjakan permintaan akan daya komputasi cerdas.” Shan Zhiguang, direktur Departemen Informatisasi dan Pengembangan Industri di Pusat Informasi Nasional, mengatakan bahwa komputasi cerdas telah berkembang pesat dan telah menjadi yang paling cepat berkembang dalam struktur daya komputasi di negara saya. Di antara model-model tersebut, model besar merupakan permintaan terbesar akan daya komputasi cerdas, yang mencakup hampir 60% dari permintaan. Diperkirakan pada tahun 2027, tingkat pertumbuhan gabungan tahunan kekuatan komputasi cerdas Tiongkok akan mencapai 33,9%.

berita

Siapa yang merencanakan chip pusat komputasi pintar?

Perkenalan

informasi kontak saya