berita

Old Huang membuat langkah mengejutkan lainnya!Server GB20 "edisi khusus" pertama diluncurkan, yang mungkin diluncurkan tahun depan

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Laporan Kebijaksanaan Baru

Editor: Departemen Editorial

[Pengantar Kebijaksanaan Baru]Media asing memberitakan bahwa Nvidia akan meluncurkan chip AI yang disesuaikan untuk pasar Cina tahun depan, dan bahkan akan mengembangkan server yang menyamainya. Ini adalah pertama kalinya dalam sejarah Nvidia.

Pertarungan antara Nvidia dan Departemen Perdagangan AS kembali meningkat!

Di bawah kendali ekspor AS, Lao Huang terus mengembangkan strategi alternatif, dan permainan kucing-kucingan pun terjadi.


Setelah penerapan peraturan pengendalian ekspor baru, Lao Huang tidak dapat menghasilkan uang di pasar Tiongkok.

Pada bulan Januari tahun ini, peraturan ekspor baru telah diterapkan tepat satu tahun, dan proporsi pasar Tiongkok dalam pendapatan Nvidia telah turun menjadi 17%. Dua tahun lalu, angka ini masih 25%+.

Dalam menghadapi regulasi, Nvidia terus meluncurkan chip "edisi khusus" yang disesuaikan untuk China. Namun, chip dengan performa yang lemah ini seringkali tidak terjual dengan baik.

Penjualan H20, yang sebelumnya memiliki awal yang buruk, baru saja mulai meningkat, namun Nvidia terkejut mendengar kabar buruknya——

Analis Jefferies mengungkapkan dalam laporan penelitian minggu lalu bahwa Departemen Perdagangan AS akan melakukan tinjauan tahunan terhadap pembatasan ekspor semikonduktor pada bulan Oktober dan mungkin melarang ekspor chip H20.

Pengawasan terus ditingkatkan, dan kali ini, Lao Huang mengedepankan yang terbaik.

Tak hanya meluncurkan chip AI andalan baru B20, namun khawatir tidak mudah digunakan, pihaknya juga meluncurkan server pendukung GB20.


Tak sulit menebak dari namanya bahwa B20 merupakan varian dari Blackwell B200 yang dirilis Nvidia pada Maret tahun ini.

Sebagai GPU tercepat hingga saat ini, B200 mampu memproses tugas tertentu hingga 30 kali lebih cepat dibandingkan pendahulunya. (misalnya, biarkan chatbot menghasilkan jawaban)

Sayangnya, ini tidak ada hubungannya dengan chip B20 "edisi khusus"...

B20, yang lahir di bawah pembatasan kebijakan pengendalian ekspor AS, ditakdirkan untuk menjadi produk tingkat pemula, sangat berbeda dengan B200 dengan kinerja AI yang terdepan di industri.

Namun, menurut sumber tersebut, meskipun B20 akan lebih lambat dibandingkan B200 dalam memproses penghitungan AI, memasang sejumlah besar chip secara bersamaan di server GB20 dapat menutupi sebagian kekurangan ini.

Hal ini akan memastikan bahwa Nvidia mempertahankan tingkat daya saing tertentu ketika bersaing dengan produk Tiongkok, sekaligus mematuhi batas atas daya komputasi chip yang diwajibkan oleh kontrol ekspor AS.

Di bawah kendali, "permainan kucing-dan-tikus" dimainkan

Sejak akhir tahun 2022, Nvidia telah berulang kali mengkonfigurasi ulang chipnya untuk pasar Tiongkok, menargetkan kebutuhan pelanggan Tiongkok yang membutuhkan chip untuk mengembangkan LLM, berusaha untuk tetap menarik bagi pelanggan Tiongkok sambil mematuhi peraturan AS.

Pada bulan Oktober 2022, pemerintah AS melarang penjualan A100 dan H100 milik Nvidia, yang merupakan chip kecerdasan buatan paling canggih pada saat itu.

Beberapa bulan kemudian, Nvidia meluncurkan dua produk alternatif, A800 dan H800, untuk pasar Cina.

Kurang dari setahun kemudian, Departemen Perdagangan AS sekali lagi memperbarui langkah-langkah pengendalian ekspornya dan memberlakukan pembatasan pada kedua chip tersebut.

Nvidia merespons dengan cepat,


Diantaranya, chip H20 memiliki kinerja terbatas tetapi kecepatan koneksi lebih tinggi, dengan memori bandwidth tinggi dan dukungan perangkat lunak yang matang, memberikan kinerja yang lebih baik.

Meskipun penjualan awalnya buruk, semakin banyak pelanggan Tiongkok yang memilih untuk membeli chip ini.

Menurut empat orang yang terlibat langsung dalam penjualan chip Nvidia di Tiongkok, perusahaan Tiongkok telah memesan lebih dari 500.000 chip H20 dengan nilai total hampir US$5,8 miliar dan akan dikirimkan pada tahun 2024.

Firma riset SemiAnalysis juga membuat perkiraan optimis bahwa Nvidia akan menjual lebih dari 1 juta chip H20 di Tiongkok tahun ini, senilai lebih dari US$12 miliar.

Namun seperti disebutkan sebelumnya, bisnis ini menghadapi ancaman baru dari Departemen Perdagangan. Jika peraturan disesuaikan pada akhir tahun, H20 mungkin dilarang dijual.

Larangan tersebut dapat terjadi dalam berbagai bentuk, termasuk larangan khusus produk, mengurangi daya komputasi sebuah chip, atau membatasi kapasitas memorinya.

Latar belakang makronya adalah Amerika Serikat secara umum diperkirakan akan terus memberikan tekanan pada kontrol ekspor terkait semikonduktor.

Amerika Serikat ingin Belanda dan Jepang lebih membatasi pasokan peralatan manufaktur chip ke Tiongkok, kata sumber.


Di bawah kendali yang semakin meningkat, semakin banyak "edisi khusus" yang mungkin muncul.


Nvidia juga dikabarkan sedang mengembangkan kartu grafis gaming andalan barunya, RTX 5090D.


Kartu grafis tersebut akan dirancang khusus untuk pasar Cina dan merupakan tindak lanjut dari RTX 4090D, kartu grafis berorientasi konsumen pertama yang memenuhi standar ekspor.

Performa chip saja tidak cukup, diperlukan server untuk mengimbanginya

Spesifikasi spesifik B20 memang belum bisa ditentukan, namun yang pasti pasti tidak akan melanggar "batas" kebijakan ekspor GPU AS.

Sama seperti pendahulunya yang lama – H20, L20 dan L2 yang diluncurkan sebelumnya, performa ketiga chip ini bisa dikatakan “epik”. Tidak hanya performanya yang buruk, tetapi juga hanya dibekali NVLink versi sisa. Menghubung.

TPP & PD dua indikator utama untuk mengunci tenggorokan

Amerika Serikat memiliki peraturan kinerja yang ketat pada ekspor GPU Tiongkok dan menggunakan indikator yang disebut "Total Processing Power" (TPP).

Metrik ini memperhitungkan TFLOPS dan keakuratan daya komputasi GPU. Secara khusus, mengalikan TFLOPS (tanpa ketersebaran) dengan presisi (dalam bit) menghasilkan TPP.

Batasan saat ini dipatok 4.800 TPP, maksudnya apa?

Mengambil referensi produk NVIDIA sebelumnya: Hopper H100 dan H200 telah jauh melampaui standar ini. TPP kedua GPU telah mencapai 16.000, lebih dari tiga kali lipat batas atas yang ditentukan.


Bahkan RTX 4090 melampaui batas dengan kekuatan komputasi FP8 sebesar 660,6 TFLOPS.

GPU desktop Nvidia paling kuat yang tetap berada dalam batas 4800 TPP adalah RTX 4090D, yang dibuat khusus untuk mematuhi batasan ekspor.


Blackwell telah menetapkan tolok ukur baru dalam kinerja komputasi, dengan solusi dual-chip yang kemungkinan akan menghasilkan sekitar 4.500 TFLOPS daya komputasi FP8, yang berarti 7,5 kali lipat dari batas ekspor.

Dengan kata lain, performa B20 akan kurang dari 1/7 performa Blackwell B200!

Tidak hanya itu, B20 juga menghadapi pembatasan tambahan – pembatasan “Kepadatan Kinerja” (PD).

Ini adalah pembatasan yang secara khusus diberlakukan pada GPU pusat data di Amerika Serikat, dan GPU konsumen tidak terpengaruh oleh hal ini.

Indikator PD dapat diperoleh dengan membagi skor TPP dengan ukuran chip. PD GPU yang diekspor ke Tiongkok tidak boleh lebih tinggi dari 6,0.

Berdasarkan indikator ini, GPU seri RTX 40 (arsitektur Ada Lovelace) tidak dapat lagi digunakan di pusat data.

Blackwell jelas lebih baik dari Ada Lovelace dalam hal kepadatan dan performa.

Dengan kata lain, Nvidia perlu membatasi secara ketat kinerja B20 atau menggunakan proporsi chip yang lebih besar untuk mematuhi peraturan terkait.

Menurut Tom's Hardware, B20 akan menjadi penerus GPU AI entry-level Nvidia A30 dan H20.

Ambil contoh H20, daya komputasi FP16-nya hanya 296 TFLOPS, TPP 2368, PD hanya 2,90, sedangkan H100/H200 1979 TFLOPS.


Pada saat yang sama, A30 memiliki skor TPP 2640 dan skor PD 3,20, sedikit lebih tinggi dari H20.

Terlihat bahwa GPU AI yang dibangun Nvidia untuk pasar Cina memiliki ruang untuk peningkatan kinerja, namun ruang tersebut sangat terbatas.

Skenario terbaiknya, Nvidia mungkin akan membuat GPU dengan TPP antara 4000 dan 4500 dan ukuran die 800 milimeter persegi.

GB20: Cobalah yang terbaik untuk menyimpan kinerja B20

Untuk membuat B20 mendatang lebih efisien, Nvidia menerapkan strategi yang digunakan pada H20, seperti meningkatkan kapasitas memori karena chip memori tidak tunduk pada kontrol ekspor saat ini.

Menurut dua orang yang terlibat dalam pengembangan server, Nvidia berupaya meningkatkan kecepatan transfer data antara memori dan prosesor B20, sehingga kumpulan data energi besar dapat diproses lebih cepat.

Tidak hanya itu, Nvidia juga akan menggunakan teknologi NVLINK (yang memungkinkan komunikasi cepat antar chip yang berbeda) dan solusi pendinginan pada desain rak GB20.

Hal ini diharapkan dapat meningkatkan pemanfaatan chip B20 dan efektivitas cluster komputasi GB20 dalam mendukung kecerdasan buatan, tambah keduanya.

Sistem GB20 akan memungkinkan pelanggan melakukan pelatihan dan inferensi AI dengan menjalankan beberapa chip secara paralel secara lebih efisien.

Sebelum GB20 terungkap, Tom's Hardware dengan berani memperkirakan bahwa B20 akan menjadi chip yang sulit dijual.

Namun kini dengan berkat GB20, tampaknya ada harapan baru.

Referensi:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- peraturan

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules