berita

3 triliun perusahaan chip, apakah mereka juga berusaha bertahan?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia berencana kembali memproduksi chip AI khusus untuk pasar China.

Menurut laporan terbaru dari Reuters, orang-orang yang mengetahui masalah ini mengatakan bahwa Intel sedang mengembangkan chip AI andalan baru untuk pasar Tiongkok yang memenuhi persyaratan kontrol ekspor AS saat ini dan menambahkan anggota lain ke jajaran chip khusus Nvidia dalam negeri.

Perlu disebutkan bahwa Nvidia merilis seri "Blackwell" pada bulan Maret tahun ini, yang diperkirakan akan diproduksi secara massal akhir tahun ini. Menurut Nvidia, B200 30 kali lebih cepat dari pendahulunya dalam tugas-tugas tertentu salah satu chip AI teratas yang tersedia saat ini.

Chip andalan khusus baru ini juga terkait dengan B200. Sumber menyebutkan bahwa Nvidia akan bekerja sama dengan Inspur Group, salah satu mitra distribusi utamanya di China, untuk meluncurkan dan mendistribusikan chip ini, yang untuk sementara diberi nama "B20". mungkin memiliki beberapa fitur B200.

Menghitung B20 ini, hanya dalam waktu setahun, Nvidia telah meluncurkan tujuh atau delapan chip khusus untuk pasar Cina.

A800 dan H800

Pada tanggal 7 Oktober 2022, pemerintah AS mengumumkan serangkaian tindakan pengendalian ekspor, termasuk memotong pasokan chip semikonduktor tertentu dan peralatan manufaktur chip ke Tiongkok.

Selain memengaruhi peralatan produksi seperti mesin fotolitografi, peraturan ini juga membatasi akses Tiongkok terhadap chip komputasi tinggi dan kecerdasan buatan dalam proses yang canggih, termasuk melarang perusahaan AS seperti Nvidia dan AMD menjual chip tersebut ke Tiongkok, dan juga membatasi kecerdasan buatan Tiongkok. . Perusahaan chip melakukan tape-out di pabrik Fab di luar negeri dengan teknologi Amerika.

Di bawah pembatasan ekspor ini, Nvidia dan AMD terkena dampaknya.

Nvidia mengatakan setelah pembatasan diberlakukan bahwa larangan tersebut memengaruhi chip A100 dan H100 yang dirancang untuk mempercepat tugas pembelajaran mesin dan dapat menghambat penyelesaian pengembangan chip H100 andalannya yang akan dirilis pada tahun 2022. Disebutkan bahwa penjualan chip yang terkena dampak di Tiongkok selama kuartal tersebut telah mencapai 400 juta dolar AS. Jika perusahaan Tiongkok memutuskan untuk tidak membeli produk pengganti Nvidia, maka uang tersebut akan hilang sia-sia.

Jadi, bagaimana sebenarnya pembatasan ekspor AS membatasi chip Nvidia?

Menurut aturan pembatasan ekspor untuk sirkuit terintegrasi komputasi tingkat lanjut (ECCN 3A090 dan 4A090) yang dikeluarkan oleh Departemen Perdagangan AS pada tanggal 7 Oktober 2022, daftar item yang dikontrol harus memenuhi ketentuan berikut:

a. Sirkuit terintegrasi dengan total kecepatan transfer dua arah dari semua input dan output, atau dapat diprogram, sebesar 600 GB/s atau lebih, selain memori volatil, dan salah satu sirkuit terintegrasi berikut:

a.1. Satu atau lebih unit prosesor digital yang menjalankan instruksi mesin, panjang bit setiap operasi dikalikan dengan kinerja pemrosesan dalam TOPS, dan jumlah seluruh unit prosesor adalah 4800 atau lebih;

a.2. Satu atau lebih "unit komputasi mentah" digital (tidak termasuk unit yang membantu pelaksanaan instruksi mesin terkait komputasi TOPS 3A090.a.1) yang panjang bit per operasinya dikalikan dengan jumlah seluruh unit komputasi Kinerja pemrosesan TOPS adalah 4800 atau lebih;

a.3. Satu atau lebih simulasi, "unit komputasi asli" multi-nilai atau multi-level yang kinerja pemrosesannya dihitung sebagai TOPS dikalikan 8, dan total semua unit komputasi mencapai atau melebihi 4800;

a.4. Setiap kombinasi unit prosesor digital dan "unit komputasi asli" yang jumlahnya dihitung sesuai dengan 3A090.a.1, 3A090.a.2 dan 3A090.a.3 berjumlah 4800 atau lebih.

Sirkuit terpadu yang dijelaskan dalam 3A090.a. mencakup unit pemrosesan grafis (GPU), unit pemrosesan tensor (TPU), prosesor saraf, prosesor memori, prosesor visi, prosesor teks, co-prosesor/akselerator, perangkat pemrosesan adaptif, perangkat logika yang dapat diprogram di lapangan. (FPLD) dan sirkuit terpadu khusus aplikasi (ASIC).

Tidak sulit untuk melihat bahwa yang paling penting adalah batas kecepatan interkoneksi chip. Menurut peraturan ini, A100 yang laris dari NVIDIA secara akurat berada dalam batas tersebut, dan kecepatan transfer antar-chipnya mencapai 600GB/s Dari batas tertentu Sampai batas tertentu, mungkin Departemen Perdagangan AS menetapkan pembatasan ini berdasarkan A100.

Untuk menghadapi kontrol ekspor, NVIDIA dengan cepat mengebiri pengganti A100-A800. Larangan AS secara resmi diumumkan pada 7 Oktober 2022, dan sebulan kemudian, NVIDIA menghadirkan A800 yang bisa dikatakan beradaptasi dengan peraturan baru. disesuaikan dengan kondisi lokal di masa lalu, namun kini disesuaikan dengan kondisi kebijakan.

Secara spesifikasi, NVIDIA A800 akan menggunakan arsitektur chip yang sama dengan GPU Ampere A100. Ini akan tersedia dalam tiga versi, dua versi PCIe 40 GB dan 80 GB, dan versi SXM 80 GB. GPU ini akan menyediakan hingga 9,7 TFLOP FP64, 19,5 TFLOP FP64 Tensor Core, 19,5 TFLOP FP32, 156 TFLOP (312 TFLOPs sparsity) TF32, 312 TFLOPs (624 TFLOPs sparsity) BFLOAT16 dan 624 TOPS (1248 TOPs sparsity) kinerja INT8. Versi 40 GB dilengkapi memori HBM2 dengan bandwidth hingga 1,555 TB/s, sedangkan versi 80 GB dilengkapi HBM2e dengan bandwidth hingga 2 TB/s.

Tentu saja, untuk memenuhi permintaan yang terbatas, bandwidth terpaksa dikurangi, dari yang semula 600GB/s menjadi 400GB/s produksi kuartal ketiga, sebuah alternatif dari GPU A100 untuk pelanggan Tiongkok, A800 memenuhi pengujian eksplisit pemerintah AS untuk pengurangan kontrol ekspor dan tidak dapat diprogram melebihi standar tersebut.”

Analis CCS Insight Wayne Lam berkomentar: "A800 tampaknya merupakan GPU A100 yang dikemas ulang yang dirancang untuk menghindari pembatasan perdagangan baru-baru ini dari Departemen Perdagangan," sambil menunjukkan bahwa 8 adalah angka keberuntungan di Tiongkok.

“Tiongkok adalah pasar yang penting bagi Nvidia, dan masuk akal secara bisnis untuk mengkonfigurasi ulang produk tersebut guna menghindari pembatasan perdagangan,” kata Lam, yang mengatakan kemampuan komunikasi antar-chip A800 berkurang secara signifikan untuk pusat data yang menggunakan ribuan chip.

Pada H100 berikutnya, Nvidia mengikutinya dan menciptakan H800. Pada A100, Nvidia menurunkan interkoneksi GPU 600 GB/s menjadi 400 GB/s, dan melakukan hal yang sama dengan H100. Menurut laporan, kecepatan interkoneksi chip H800 telah dikurangi menjadi sekitar setengah dari H100, yaitu dari 800 GB/dtk menjadi 400 GB/dtk. Dibandingkan dengan A800, kinerja H800 memiliki dampak yang lebih besar, yang pertama hanya berkurang sebesar 33%, dan yang terakhir berkurang sebesar 50%.

Pada saat itu, juru bicara NVIDIA menolak untuk mengungkapkan perbedaan antara H800 dan H100 untuk pasar Tiongkok, hanya mengatakan bahwa "produk seri 800 kami sepenuhnya mematuhi peraturan kontrol ekspor."

Ketika pabrikan luar negeri dengan panik membeli A100 dan H100, pabrikan dalam negeri hanya dapat memilih H800 dan A800 dengan konfigurasi yang lebih rendah. Versi khusus chip NVIDIA telah membatasi pengembangan model AI domestik besar sampai batas tertentu.

H20 dan RTX 4090D

Bagi perusahaan dalam negeri, A800 dan H800 memiliki kualitas yang baik dan buruk.Hal buruknya adalah setelah bandwidth Internet dipotong, kinerja kedua chip ini sedikit lebih buruk, dan kecepatan pelatihannya juga jauh lebih lambat keduanya baik dan buruk. Dapat dipesan melalui saluran Zhengcheng, tetapi dibandingkan dengan perusahaan asing, harga chip akan lebih tinggi.

Namun A800 dan H800 juga tidak bertahan lebih dari setahun. Pada tanggal 17 Oktober 2023, Departemen Perdagangan AS mengeluarkan peraturan kontrol baru untuk mengatur ekspor sirkuit terintegrasi komputasi canggih, peralatan manufaktur semikonduktor, dan item yang mendukung aplikasi superkomputer dan penggunaan akhir yang dikeluarkan pada tanggal 7 Oktober 2022. Pembaruan tambahan.

Yang paling utama adalah perubahan dalam parameter kontrol. Aturan akhir sementara menghapus "bandwidth interkoneksi" sebagai parameter untuk mengidentifikasi chip yang dibatasi berdasarkan ECCN 3A090, dan sebagai gantinya menggantikannya dengan "bandwidth interkoneksi" sebagai parameter untuk mengidentifikasi chip yang dibatasi berdasarkan ECCN 3A090 jika chip melebihi dua parameter yang dikalibrasi dalam ECCN 3A090 (3A090.a dan 3A090.b), ekspor akan dibatasi.

Menurut dokumen Departemen Perdagangan AS, parameter peraturan 3A090.a yang direvisi akan mengatur sirkuit terpadu dengan satu atau lebih unit pemrosesan digital, dan "kinerja pemrosesan total" dari unit-unit ini harus 4800 atau lebih, atau "pemrosesan total" performance" adalah 1600 atau lebih tinggi, dan "Kepadatan Kinerja" adalah 5,92 atau lebih tinggi. ECCN 3A090.b baru akan mengatur sirkuit terintegrasi dengan satu atau lebih unit pemrosesan digital yang harus memiliki salah satu kondisi berikut: "kinerja pemrosesan total" 2400 atau lebih tetapi kurang dari 4800 dan "kepadatan kinerja" 1,6 atau 1,6 atau lebih tetapi kurang dari 5,92, atau "kinerja pemrosesan total" adalah 1600 atau lebih, dan "kepadatan kinerja" adalah 3,2 atau lebih dari 3,2 tetapi kurang dari 5,92.

Selain itu, aturan tersebut menciptakan pengecualian lisensi yang menciptakan “Pemberitahuan Pengecualian Lisensi untuk Komputasi Tingkat Lanjut” baru untuk IC tingkat konsumen dengan kemampuan kecerdasan buatan di bawah ambang batas yang membatasi. Pengecualian ini berlaku untuk dua produk, satu dirancang atau Chip yang dijual untuk digunakan dalam data pusat, yang kedua adalah chip yang tidak dirancang atau dijual untuk penggunaan pusat data, memiliki "kinerja pemrosesan total" 4800 atau lebih tinggi.

Dibandingkan dengan peraturan pada tanggal 7 Oktober 2022, peraturan baru ini sekali lagi memperluas cakupan pengendalian. Berdasarkan aturan ganda yaitu kinerja pemrosesan total dan kepadatan kinerja, baik produk yang tidak dikebiri maupun yang dikebiri termasuk dalam pengendalian ekspor lingkup, A800 dan H800 telah terpengaruh, sementara produk Nvidia lainnya juga telah terpengaruh. L40 dan L40S untuk pasar penalaran, dan RTX 4090 di bidang konsumen juga telah dimasukkan dalam larangan tersebut.

Hal ini merupakan pukulan telak bagi Nvidia, yang berarti produk mainstream yang dijual Nvidia pada saat itu tidak bisa dijual di China karena adanya pengendalian ekspor. Perlu Anda ketahui bahwa pada tahun-tahun sebelumnya, pendapatan bisnis data center dari pasar China ikut menyumbang sekitar pendapatan keseluruhan Nvidia. 20% hingga 25%, dan pada kuartal keempat tahun fiskal 2024, karena kontrol ekspor, pendapatan di pasar Tiongkok anjlok hingga satu digit.

Tak berdaya, Nvidia hanya bisa mengayunkan parangnya lagi.

Pada 16 November 2023, satu bulan setelah aturan baru dirilis, NVIDIA meluncurkan chip GPU khusus untuk pasar Cina-H20, L20, dan L2. H20 didasarkan pada arsitektur Hopper NVIDIA, sedangkan L20 dan L2 didasarkan pada Ada Arsitektur.

Diantaranya, dua chip L20 dan L2 telah disesuaikan masing-masing berdasarkan L40 dan L4 karena arsitekturnya sudah lama dan tidak umum digunakan dalam penalaran dan pelatihan, maka keduanya belum mendapat banyak perhatian. H20 lebih menarik. Meskipun telah memperoleh NVLink penuh 900GB/s karena peraturan baru yang tidak lagi membatasi kecepatan Internet, kinerjanya harus dikurangi secara signifikan Tingkatnya bisa mencapai 90%, namun kinerjanya dalam lingkungan interkoneksi multi-kartu sebenarnya masih hanya mendekati 50% dari H100.

Untuk RTX 4090 di pasar konsumen, NVIDIA juga meluncurkan penggantinya - RTX 4090D pada bulan Desember tahun lalu. Chip khusus yang mematuhi kontrol ekspor AS ini telah dikebiri dalam hal inti CUDA dan konsumsi daya inti CUDA telah dikurangi. 12,8%, konsumsi daya juga berkurang dari 450W menjadi 425W, pengurangan 5,9%, semua spesifikasi inti lainnya tetap sama.

Karena sedikit peningkatan pada frekuensi utama, dalam beberapa pengujian benchmark, performa 4090D hanya sekitar 5% lebih rendah dibandingkan 4090. Dibandingkan dengan chip AI, kesenjangan ini tampaknya berada dalam kisaran yang dapat diterima.

Empat chip khusus berturut-turut pada akhir tahun 2023 telah meringankan rasa malu Nvidia China sampai batas tertentu dan mencegahnya kehabisan barang untuk dijual. Namun, setelah dua putaran pembatasan, perusahaan besar dan perusahaan kecil dan menengah mengalaminya mulai mencari jalan keluarnya adalah dengan membeli chip dalam negeri, membangun server di luar negeri, atau membeli H100/200 dan A100 melalui jalur tidak resmi, yang tidak punya pilihan selain menyebar ke produsen dalam negeri.

Keterampilan pisau Lao Huang

Pemain DIY yang akrab dengan GPU gaming pasti tidak asing lagi dengan keterampilan pisau Lao Huang.

Ambil contoh yang relatif baru. Satu tahun setelah peluncuran seri RTX 20, untuk lebih membedakan lini produk dan merespons peluncuran produk baru dari seri AMD RX5000 di sebelahnya, Nvidia meluncurkan seri RTX 20 Super.

Meski juga berbasis core TU106 dan TU104, namun Nvidia telah menggunakan kedua core tersebut untuk mengukir lima kartu grafis, yakni RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super, dan RTX 2080. Diantaranya, gap terkecil adalah antara Kesenjangan kinerja teoretis antara TU106 core RTX 2060 Super dan RTX 2070 hanya sekitar 5%, dan skor lari aktual serta pengujian game juga sangat dekat. Dapat dikatakan bahwa Nvidia telah melakukan pengebirian secara ekstrem.

Saat ini, chip yang dimodifikasi khusus yang diproduksi oleh NVIDIA untuk China tidak lebih dari pengulangan masa lalu dan kembali ke bisnis lama.

Selain B20 yang kami sebutkan di awal, Nvidia juga berencana memamerkan keahliannya di pasar konsumen. Menurut laporan, RTX 5090D, versi pengurangan dari RTX 5090, diperkirakan akan diluncurkan pada Januari 2025. diharapkan didasarkan pada arsitektur Blackwell Nvidia. Penggunaan proses 4NP TSMC dapat mengurangi spesifikasi inti untuk menghindari pembatasan ekspor AS.

Menghitung dua chip yang dikabarkan ini, Nvidia sudah memiliki jajaran produk khusus yang sangat besar di Cina: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Beberapa orang cukup optimis dengan prospek chip edisi khusus ini. Organisasi riset SemiAnalysis memperkirakan Nvidia diperkirakan akan menjual lebih dari 1 juta chip H20 di China tahun ini, senilai lebih dari 12 miliar dolar AS.

Namun Nvidia masih memiliki banyak kekhawatiran. Menurut laporan dari analis Jeffries, ketika Amerika Serikat melakukan tinjauan tahunan terhadap kontrol ekspor semikonduktor pada bulan Oktober, “sangat mungkin” akan melarang penjualan chip H20 Nvidia ke Tiongkok. Analis tersebut mengatakan bahwa larangan tersebut mungkin melalui “produk tertentu larangan, batas kemampuan komputasi yang lebih rendah dan/atau kapasitas memori terbatas" untuk diterapkan.

Selain itu, kartu kepatuhan yang diproduksi secara artifisial seperti H20 pada dasarnya didasarkan pada pengebirian inti yang ada. Hal yang sama berlaku untuk B20. Kartu tersebut dapat digunakan sebagai inti dari H200 dan B200, tetapi sekarang hanya dapat digunakan untuk menjual kartu khusus yang lebih murah. edisi. , dan masa penjualannya kemungkinan besar hanya lebih dari satu tahun, jadi ini adalah bisnis yang merugi tidak peduli bagaimana Anda melihatnya.

Tapi Nvidia tidak punya jalan keluar. Ia hanya bisa berusaha semaksimal mungkin untuk menyeimbangkan aturan dan pasar. Tapi berapa banyak perusahaan di China yang bersedia membayar untuk chip edisi khusus yang berulang kali dihentikan?