berita

Pengepungan dan Penindasan NVIDIA |. Deep Krypton

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teks|Qiu Xiaofen

Wawancara|Qiu Xiaofen dan Yang Xiao

Editor|Su Jianxun Yang Xuan

melawan

Grup rahasia WeChat disebarkan dari mulut ke mulut di antara orang-orang dari perusahaan chip AI di Zhangjiang, Shanghai. Nama grup tersebut adalah "Grup Pemanasan Grup Chip Domestik". bahkan pesaing akan bertukar informasi dan bertukar sumber daya bisnis.

"Kelompok chip domestik untuk kehangatan" telah menggambarkan zona gencatan senjata, di mana rekan kerja dapat melakukan gencatan senjata untuk sementara dan saling membantu, hanya karena setiap orang memiliki musuh yang sama: NVIDIA.

Gara-gara keberadaan Nvidia, penjualan perusahaan chip dalam negeri sedikit terhina.

Li Ming (nama samaran) adalah seorang penjual di perusahaan GPU dalam negeri. Ketika booming AI dimulai, dia pergi menemui pelanggan dengan percaya diri, tetapi dia tidak punya waktu untuk menyapa.

"Dibandingkan dengan chip NVIDIA A100, apa perbedaan antara barang Anda? NVIDIA memiliki NVLink, apa yang Anda miliki?" (Catatan Penulis: NVLink menghubungkan beberapa chip GPU untuk mencegah data GPU dipindahkan ke CPU untuk perhitungan guna meningkatkan efisiensi komputasi)

Melihat bahwa mereka tidak dapat mengesankan pelanggan dengan produk dan teknologi mereka, tim Li Ming mulai memikirkan cara untuk mengandalkan koneksi dan menemukan "orang yang lebih berkuasa" untuk melobi, namun pelanggan masih melambaikan tangan dan berkata, "Kami masih ingin menggunakan NVIDIA."

NVIDIA A100, dengan 54 miliar transistor yang dikemas dalam area seluas 826 milimeter persegi, adalah kunci untuk membuka kotak ajaib model AI besar.

Pelatihan model besar ibarat "memurnikan ramuan" dalam data masif, dengan tujuan mengetahui pola perubahan data;Menggunakan chip NVIDIA untuk melatih model besar seperti meminta ratusan juta orang dengan IQ 200 untuk mengerjakan matematika, sedangkan efek chip lain hanya setara dengan meminta ribuan orang dengan IQ 100 untuk melakukan perhitungan.


Gambar NVIDIA A100 dari situs resmi NVIDIA

Perusahaan-perusahaan teknologi terkemuka semuanya bergegas membeli Nvidia. Siapa pun yang memiliki GPU kelas atas NVIDIA paling banyak akan memiliki kesempatan untuk melatih model besar yang lebih cerdas.

Informasi publik menunjukkan bahwa OpenAI saat ini mengendalikan GPU kelas atas Nvidia dalam jumlah terbesar di dunia, setidaknya 50.000 buah; Google dan Meta juga merupakan pemilik cluster Wanka (sekitar 26.000); Jaringan internet dengan cluster GPU Wanka Nvidia high-end yang terbesar adalah ByteDance (13.000).

NVIDIA memonopoli sumber daya terbaik dalam rantai industri global - NVIDIA memiliki kapasitas produksi chip canggih yang paling melimpah di TSMC, memiliki kelompok pengguna insinyur terbesar di dunia, dan mengontrol sumber daya komputasi di banyak perusahaan AI.

Monopoli absolut sering kali melahirkan ketidakpuasan, kemarahan, dan pelarian.

"Setiap orang yang membuat model besar saat ini pada dasarnya benar-benar merugi! Hanya satu yang menghasilkan uang! NVIDIA," kata orang dalam industri dengan marah—"Margin keuntungan NVIDIA membuat semua pelanggan tidak nyaman dan merugikan industri AI!".

Laporan keuangan menunjukkan margin laba kotor Nvidia mencapai 71%, di antaranya produk populer seri A100 dan H100 memiliki margin laba kotor hingga 90%. Sebagai perusahaan perangkat keras, Nvidia sebenarnya menikmati margin laba kotor yang lebih tinggi dibandingkan perusahaan perangkat lunak Internet.

Harga tinggi dan keuntungan besar menyebabkan pelanggan besar Nvidia mulai mengungsi. Pada tanggal 30 Juli, Apple mengumumkan bahwa model AI-nya dilatih dengan 8.000 Google TPU, sedangkan konten NVIDIA adalah 0. Segera setelah berita ini keluar, harga saham NVIDIA turun lebih dari 7% pada tanggal 31 Juli, penurunan terbesar di masa lalu. tiga bulan, dan nilai pasarnya menguap $193 miliar,Saya hampir kehilangan Pinduoduo.


Grafik penurunan harga saham NVIDIA dalam setahun terakhir

Bagi semua perusahaan GPU dalam negeri yang ingin mengambil bagian dari Nvidia, tahun 2022 adalah tahun balik. Beberapa putaran larangan telah dikeluarkan di Amerika Serikat. Nvidia, yang terpaksa mencari nafkah, terus meluncurkan versi chip yang dikebiri di Tiongkok, namun segera dilarang lagi:

  • Pada bulan September 2022, A100/H00 dilarang diekspor ke Tiongkok, dan NVIDIA meluncurkan versi yang dikebiri A800/H800; pada bulan Oktober 2023, A800/H800/L40/L40S/RTX4090 dilarang diekspor ke Tiongkok; Pendiri NVIDIA Huang Jenxun mengatakan akan mendorong versi chip L20 dan H20 yang dikebiri ke China.

Namun, versi yang dikebiri memicu kecaman yang lebih keras dari industri film. H20 Nvidia yang akan datang harganya setengah dari harga Nvidia H100, tetapi kinerjanya hanya 1/3 dari harga sebelumnya. Seseorang di industri AI dengan marah mengecam - " Bukankah ini hanya mencuri uang? Pajak IQ murni! "

Ketika pelanggan Nvidia menjadi tidak puas dan marah, perusahaan chip dalam negeri yang ingin menggantikan Nvidia "dipelihara" oleh emosi ini.

Dulu, mereka hanya bisa mengikuti jejak Nvidia dan memakan sedikit kuenya. Data dari perusahaan analisis semikonduktor TechInsights menunjukkan bahwa pada tahun 2023, pangsa pasar Nvidia dalam pengiriman GPU pusat data akan mencapai 98%.Hanya sedikit 2%.

Kini setelah pelarangan diberlakukan, Nvidia yang sempurna telah terkoyak di pasar Cina. Siapa yang bisa menggantikan Nvidia? Produsen chip AI dalam negeri melihat adanya harapan.

“Tahun ini, 90% pasar NVIDIA di China sudah dilepas.Bisa atau tidaknya kamu mengambilnya tergantung pada kemampuanmu.", ujar pendiri perusahaan GPU dalam negeri.

36 Krypton pernah menerbitkan "Deep Krypton | CATL: Cracks in the Trillion Battery Empire" pada tahun 2021. Dalam industri baterai daya, CATL tidak ada bandingannya dan diincar oleh para pesaing.

Saat ini, Nvidia, yang merupakan pemain dominan di bidang chip AI, juga dianggap sebagai duri dalam daging oleh banyak rekannya. Namun, perbedaan antara Nvidia dan Nvidia adalah hambatannya lebih tinggi dan kesenjangan dengan lawan-lawannya bahkan lebih luas.

Kami mencoba menemukan "celah di NVIDIA" melalui perlawanan dari lawan-lawan NVIDIA. Melihat industri GPU, meskipun produsen GPU dan chip AI dalam negeri lemah, mereka memahami pasar Cina dengan lebih baik dan metode permainan mereka lebih terlokalisasi dan sebagainya Intel, AMD, dll. Raksasa chip yang sudah mapan memiliki amunisi yang lebih banyak untuk menghadapi Nvidia secara langsung.

Dalam jangka pendek, Nvidia tidak akan kalah, namun tidak akan dibiarkan begitu saja. Hal ini ditakdirkan menjadi perang berdarah.

Kesuksesan besar

Jika ingin menerobos, Anda harus menemukan kelemahan lawan.Salah satu kelemahan Nvidia: kesombongan.

Industri chip pada dasarnya adalah industri perangkat lunak To B. Pelanggan memerlukan layanan "pendampingan" dari produsen chip, seperti men-debug perangkat keras dan membuat perangkat lunak dan perangkat keras kompatibel. Hanya jika kemitraan sudah ada, pelanggan akan menjadi kaku dan produk chip tidak akan mudah diganti.

Namun, banyak pakar chip dalam negeri mengatakan kepada 36Kr bahwa di pasar Tiongkok, kecuali pembeli besar dengan skala miliaran seperti BAT dan Byte, hampir sulit bagi sebagian besar perusahaan lain untuk mendapatkan investasi dari Nvidia meskipun volume transaksinya mencapai puluhan juta. . Layanan purna jual.

Dengan kata lain, ketika para insinyur China yang menggunakan chip NVIDIA merasa ragu, mereka hanya dapat mengandalkan diri mereka sendiri untuk mencari dokumen di situs resmi NVIDIA, atau pergi ke komunitas untuk belajar sendiri.

Saat bekerja sama dengan NVIDIA, berbagai kebutuhan pelanggan Tiongkok seringkali tidak terpenuhi.Seseorang di industri chip mengatakan kepada 36Kr bahwa Nvidia umumnya mempromosikan solusi lengkap tercanggih dan termahal di China. Ketika pelanggan membuat permintaan khusus untuk skenario tertentu, mereka biasanya ditolak tentang hal itu sendiri, atau temukan perusahaan algoritma yang kuat untuk melakukannya."

Pendekatan Nvidia ini telah mengumpulkan banyak keluhan dari pelanggan kecil dan menengah. “Nvidia, sebagai produsen besar sekarang, tidak lagi terlalu memperhatikan pelanggan kecil seperti dulu. Produk mereka tidak memiliki penantang dan mereka tidak perlu bekerja keras untuk menyenangkan pelanggan,” kata orang yang disebutkan di atas.

Namun di masa lalu, kebangkitan ekosistem NVIDIA sebenarnya menegaskan pentingnya layanan bagi industri chip: Pada tahun 2006, ketika ekosistem CUDA baru saja dimulai, produk NVIDIA tidak sebaik chip dalam negeri saat ini. Namun tim NVIDIA pertama-tama memulai dengan tim peneliti ilmiah di universitas, dan kemudian merambah ke perusahaan start-up di setiap subsektor untuk mengadaptasi perangkat lunak dan perangkat keras, dan baru kemudian menjadi negara besar saat ini.


NVIDIA H100 Sumber: Situs web resmi NVIDIA

Produsen chip Tiongkok juga menyadari hal ini dan mencoba memulai dengan layanan pelanggan.

Sebuah perusahaan chip AI dalam negeri yang tidak ingin disebutkan namanya telah berusaha sejak tahun 2023 untuk membawa personel penelitian dan pengembangan back-end ke garis depan untuk memberikan layanan pribadi - tidak hanya berada di lokasi untuk pelatihan bersama, tetapi juga untuk menyediakan pelanggan dengan a tim personel R&D yang berdedikasi setelah pesanan penjualan ditempatkan. Harga unit pelanggan berkisar dari beberapa juta hingga ratusan ribu, dan Anda dapat menikmati konsultasi 24/7.

Menyediakan layanan yang terlokalisasi dan penuh perhatian saja masih jauh dari cukup. Setelah NVIDIA mundur dari Tiongkok,Industri chip tidak lagi sekadar pertarungan antar produk chip itu sendiri. , tetapi juga menguji pemahaman mereka masing-masing tentang jendela waktu. Produsen chip Tiongkok menerkam mereka seperti sekawanan serigala, dan penawaran yang gencar pun dimulai.

Huawei datang dengan paling ganas. Huawei sebelumnya bekerja sama dengan iFlytek untuk merilis perangkat "Spark All-in-One" yang dilengkapi dengan "Ascend 910B".

Chip ini pernah dikatakan "sebanding dengan NVIDIA A100" dalam hal kemampuan kartu tunggal. Apa yang tidak diketahui adalah sisi sulit di balik kasus gemilang ini - 36 Krypton mengetahui bahwa Huawei tidak segan-segan membayar biaya tenaga kerja dan mengerahkan ratusan insinyur untuk membantu iFlytek menyesuaikan parameter.


Huawei dan iFlytek merilis mesin Spark all-in-one, sumber: iFlytek

Meskipun ini disebut "buatan tangan" oleh industri, segera setelah kasus benchmark keluar, banyak perusahaan model besar dan perusahaan Internet memberikan bantuan kepada Huawei untuk pengujian.

Sebuah perusahaan penjualan chip dalam negeri terkejut saat mengetahui bahwa sejak Juli tahun lalu, manajemen tingkat tinggi Huawei terlihat ditempatkan di sana di setiap proyek pusat komputasi pintar yang telah ditender secara publik naik untuk mengabdi, dan bahkan kehilangan uang pada beberapa proyek utama untuk mendapatkan pendapatan dari proyek lain."

Perusahaan chip yang tidak disebutkan namanya tersebut juga memiliki 200 tenaga penjualan inti—suatu konfigurasi yang sangat langka di industri chip dalam negeri. Tim penjualan mereka memulai dari tiga bidang terpanas untuk implementasi model besar, keuangan, hukum, dan industri, dan muncul di hampir setiap pameran yang berkaitan dengan daya komputasi. "Dalam industri chip, sumber daya adalah yang utama. Jika Anda berjalan lambat, Anda akan mati ." Hilang".

Perang harga tersembunyi untuk chip dalam negeri juga telah dimulai.

Seseorang di industri chip mengatakan kepada 36Kr bahwa tujuan mereka adalah memenangkan lebih banyak pesanan untuk pusat komputasi cerdas benchmark terlepas dari harga satuan. 36 Krypton telah mengamati bahwa untuk mengurangi biaya, beberapa perusahaan domestik tidak ragu-ragu untuk menghapus HBM (memori bandwidth tinggi) yang mahal dari kartu inferensi mereka, dan bahkanDikirim dengan harga 50% lebih rendah dari harga biaya.

"Apa pun yang terjadi, semua orang masih berharap untuk menerobos dari berbagai titik masuk dan masing-masing mengambil sebagian kecil dari NVIDIA, sehingga NVIDIA bukan lagi satu-satunya."

Namun kenyataannya kejam. Dari segi produk, chip AI dalam negeri pasti akan menghadapi berbagai masalah.

Seorang ahli chip memberi contoh kepada 36Kr: Mungkin hanya diperlukan waktu sepuluh hari untuk memproses kumpulan data yang sama menggunakan cluster A100 Nvidia, tetapi mungkin memerlukan waktu beberapa bulan untuk menggunakan beberapa produk chip dalam negeri.Waktu akumulasi perangkat keras chip dalam negeri terlalu singkat, dan kurangnya proses lanjutan serta kesenjangan perangkat keras, sehingga menghasilkan efisiensi yang rendah.

Kekurangan perangkat lunak juga terlihat jelas. Pelaku industri lain menguji dan menemukan bahwa ketika menggunakan chip domestik untuk menjalankan model besar, jika Anda ingin melakukan lebih banyak aplikasi keren di dalamnya, setelah model dasar besar diubah, chip domestik akan mudah crash. "Dalam banyak kasus, kami menggunakan domestik keripik." Pada dasarnya, Anda memegang hidung Anda dan menggunakannya."

Saat ini, setiap perusahaan telah benar-benar melihat dengan jelas strategi "pengepungan dan penindasan" saat ini, dan secara bertahap membedakannya ke jalur yang lebih realistis:

Meskipun masih ada beberapa faksi yang terus berpindah ke cluster Wanka, fokus pada skenario pelatihan, dan bersikap keras terhadap NVIDIA yang diwakili oleh Moore Threads dan Huawei; namun mayoritas faksi memilih untuk lebih fokus pada penggunaan model/besar; model kecil di berbagai industri. Penerapan berbagai industri dimulai dari penalaran skenario yang tidak memerlukan perangkat keras dan perangkat lunak yang tinggi, diwakili oleh Suiyuan, Tianshu Zhixin, dll.

(Catatan 36Kr: Model besar memiliki dua tautan: pelatihan dan inferensi: pelatihan adalah proses menemukan pola dari miliaran database."membuat"Model besar;"menggunakan"Proses model besar tidak terlalu sulit danPersyaratan perangkat keras dan perangkat lunak yang lebih rendah, hubungan lebih dekat dengan industri)


Moore Thread merilis cluster Kua'e Wanka pada Konferensi Kecerdasan Buatan 2024 dengan 36 tembakan krypton

"Kami tidak mengejar Nvidia secara membabi buta sekarang. Kami tidak mampu mengejarnya, dan kami tidak berani membabi buta membuat chip dengan daya komputasi yang sangat besar," kata salah satu pelaku industri chip terus terang.

Pertimbangan realistis bagi produsen chip dalam negeri adalah milik NvidiaFokus utamanya bukan di sini, dan pabrikan dalam negeri telah menghindari perang frontal Nvidia.

Sebelumnya, sebagian besar perusahaan menggunakan kartu grafis gaming kelas konsumen NVIDIA 4090 untuk menjalankan inferensi berdasarkan pertimbangan biaya. Kartu ini memiliki banyak masalah: konsumsi daya yang berlebihan, memori yang tidak mencukupi, dan penonaktifan. Pejabat Nvidia juga tidak mengizinkan kartu grafis tingkat konsumen ini digunakan untuk inferensi model besar.

Perusahaan chip dalam negeri telah memasuki celah NVIDIA. Tianshu Zhixin dan Suiyuan sama-sama mendorong kartu inferensi yang bersaing dengan 4090 tahun ini, dengan nilai jual memori besar, konsumsi daya rendah, dan pasokan stabil.

Produsen chip dalam negeri juga telah memperjelas pentingnya mengidentifikasi segmen pasar. Misalnya, untuk beberapa skenario yang sensitif terhadap daya, kami fokus pada chip kecil berdaya rendah; atau kami dapat terjun ke skenario khusus seperti pengoptimalan video untuk melakukan bisnis kecil namun indah.

Medan perang para raksasa sedang tegang.

Ketika perusahaan GPU dalam negeri menulis "melampaui NVIDIA" ke dalam PPT, itu lebih seperti sebuah visi yang indah. Kelompok perusahaan ini sudah lama tidak berdiri dan telah mengikuti tren substitusi dalam negeri , itu dianggap sebagai suatu prestasi. Nvidia adalah saingan sekaligus tolok ukur bagi mereka.

Namun jika berbicara tentang Intel dan AMD, yang senioritasnya sebanding dengan Nvidia, suasananya bahkan lebih mencekam.

Kami secara internal memandang Nvidia sebagai musuh bebuyutan kami", kata pengembang lini produk seri MI AMD kepada 36Kr.

Di Taipei Computer Show (Computex 2024) pada bulan Juni tahun ini, pendiri AMD Su Zifeng (dia juga sepupu pendiri Nvidia Huang Jensen) juga untuk pertama kalinya mengklarifikasi ritme produk AMD masa depan pada GPU-iterasi yang baru setiap tahun. Produk GPU konsisten dengan ritme pembaruan Nvidia.

Hampir setiap kali Nvidia meluncurkan GPU, AMD akan membelinya dari pasar dan segera membongkarnya untuk dibandingkan dengan produk yang belum diluncurkan.

“Kami perlu menambahkan beberapa fitur (indikator) di sini dan meningkatkan parameter di sana.” Apa yang mereka kejar adalah “perangkat keras tidak bisa ketinggalan dari NVIDIA dan parameternya sedikit lebih baik,” kata orang tersebut kepada 36 Krypton.


Su Zifeng merilis Instinct MI325X di Taipei Computex tahun ini

Sejak tahun 2023, mitra ekosistem AMD di Tiongkok akan menerima permintaan baru untuk pengoptimalan perangkat lunak dari AMD hampir setiap dua hari. Untuk mempromosikan GPU mereka, para eksekutif AMD terkadang memerlukan departemen CPU yang lebih menguntungkan untuk mencocokkan GPU untuk membuat pesanan, sehingga berisiko bahwa CPU tersebut tidak akan dijual.

Masyarakat AMD membakar dupa dan menyembah Buddha setiap hari, dengan harapan kita dapat memperbaiki ekologi”, kata seorang eksekutif perusahaan ekologi, menurutnya, saat iniSudah ada lebih dari 10 vendor cloud dan pelanggan To B di Tiongkok, dalam adaptasi dan verifikasi efek terkait chip AMD.

Dibandingkan dengan produsen chip dalam negeri yang cemas, keunggulan raksasa chip asing di tingkat perangkat keras adalah mereka memiliki proses yang canggih dan kapasitas produksi HBM. Oleh karena itu, tidak ada kesenjangan yang besar antara produk AMD dan Intel dibandingkan dengan produk Nvidia sampai batas tertentu.

Data resmi menunjukkan bahwa produk AMD (MI300X yang dirilis pada Desember 2023) sebelumnya mengklaim daya komputasinya 1,2 kali lipat dari Nvidia H100;

Produk Intel (Gaudi 3 dirilis pada April 2024) juga jauh melampaui H100 dalam hal efisiensi energi dan kinerja inferensi. Tentu saja lebih murah juga. Harga GPU AMD sekitar 70 hingga 80% dari produk benchmark Nvidia.

Namun semua pabrikan yang agresif terhadap Nvidia menghadapi masalah yang sama:Betapapun unggulnya perangkat keras kita, ia dibayangi oleh inferioritas perangkat lunak, seperti halnya kekurangan sebuah tong.

Di era ketika GPU hanya dapat digunakan untuk komputasi grafis, platform perangkat lunak CUDA yang diluncurkan oleh NVIDIA setara dengan menyediakan seperangkat antarmuka pemrograman kepada pengembang, memungkinkan mereka untuk dengan bebas menulis program komputasi pada GPU menggunakan bahasa pemrograman yang paling mereka kenal. dengan.

Izinkan saya memberi Anda sebuah analogi. Mengapa CUDA tidak bisa melampauinya? Ini seperti Anda belajar suatu bahasa dan telah bekerja dalam bahasa ini selama bertahun-tahun. Jika saya meminta Anda untuk mengubah bahasa, apakah Anda akan merasa tidak nyaman? apakah kamu tidak bersedia?" Seorang karyawan perusahaan chip memberi contoh pada 36Kr.

CUDA adalah penghalang terdalam bagi ekosistem perangkat lunak Nvidia.Bahkan Intel dan AMD yang merupakan perusahaan besar pun tidak bisa menyalip perusahaan lain dalam waktu singkat.

Seorang mantan karyawan tim GPU Intel mengatakan kepada 36Kr bahwa mereka telah mengerahkan lebih dari 3.000 insinyur di seluruh dunia dan berinvestasi selama tiga atau empat tahun, tetapi hanya meningkatkan akurasi dari 0% menjadi 4% - mereka menggunakan chip Intel untuk mengonversi potret dan menunggu Setelah sekian lama, informasi tersebut hilang hingga "bukan lagi wajah manusia".


CEO Intel Kissinger merilis seri chip Gaudi

Kekeliruan “ayam dan telur” muncul kembali. Justru karena tidak banyak orang yang menggunakan GPU AMD dan Intel, dan bahkan lebih sedikit lagi orang yang menggunakan platform perangkat lunak terkait (ROCm, oneAPI), sehingga sulit bagi siapa pun untuk sepenuhnya memanfaatkan kemampuan perangkat keras mereka yang sebenarnya.

“CUDA NVIDIA selalu memiliki begitu banyak pengembang yang melakukan iterasi pada algoritmanya, membantu NVIDIA membuat inferensi dan pelatihan menjadi sangat efisien. Hasilnya, NVIDIA selalu memiliki daya tawar, dan selalu tahu apa yang harus dilakukan oleh chip berikutnya, tapi inilah AMD. memusingkan baik bagi Intel maupun Intel,” kata CEO sebuah perusahaan ekosistem AMD dengan blak-blakan.Perangkat lunak AMD, ROCm, "sama seperti CUDA NVIDIA 20 tahun lalu."

Namun bagi pelanggan hilir, di sinilah risikonya muncul.

Memverifikasi model besar pada dasarnya adalah eksperimen dengan ketidakpastian. Jika Anda masih ingin menjalankannya pada chip yang belum diverifikasi, ini sama dengan menggabungkan dua variabel yang tidak dapat dikontrol - meninggalkan Nvidia berarti harus membayar sejumlah besar biaya migrasi ketakpastian.

Meskipun demikian, pengepungan dan penindasan terhadap Nvidia masih menjadi pertempuran yang harus diperjuangkan oleh AMD dan Intel.

Arsitektur chip global dibagi menjadi tiga bagian: arsitektur X86 memandu bidang PC dan didominasi oleh Intel dan AMD; pasar seluler didominasi oleh Arm; dan NVIDIA mendominasi pasar kecerdasan buatan.

Dalam hampir satu setengah tahun sejak revolusi AI baru diperkenalkan, Nvidia pernah melampaui angka nilai pasar sebesar $3 triliun, yang kini setara dengan nilai pasar gabungan 7 Intel + AMD.

Setelah 20 tahun, “pengepungan dan penindasan” raksasa chip terhadap Nvidia,Itu adalah pertempuran yang mencemaskan lainnya, dan itu juga merupakan serangan balik yang terlambat.

retakan nyata

Ketika perusahaan chip AI dalam negeri membentuk pasukan semut, AMD dan Intel berusaha sekuat tenaga, apakah Nvidia benar-benar terguncang menghadapi pengepungan seperti itu?

Retakan di kerajaan Nvidia menyebar secara diam-diam.

Sebuah sinyal yang harus diwaspadai oleh Nvidia adalah bahwa OpenAI, Google, Microsoft... pelanggan besar yang telah mengisi ulang Nvidia karena keyakinan mereka pada AI mengambil langkah pertama menuju "anti-Nvidia".

Chip yang dikembangkan sendiri merupakan permainan catur yang telah direncanakan oleh berbagai perusahaan sejak lama. Seorang mantan karyawan inti tim TPU Google mengatakan kepada 36Kr bahwa Google, yang menggunakan 1/4 kekuatan komputasi dunia,“Kami mungkin tidak membeli chip eksternal pada akhir tahun ini.”

Dulu, TPU yang dikembangkan sendiri oleh Google lebih didasarkan pada pertimbangan biaya, seperti kekhawatiran bahwa Nvidia akan menaikkan harga sesuka hati atau pasokan tidak akan cukup stabil. Kini strategi pembuatan inti Google lebih radikal -.“Hampir terlepas dari biaya dan biayanya.”

OpenAI memiliki persiapan yang tak terhitung jumlahnya. Mereka berencana mengumpulkan dana hingga 7 triliun dolar AS untuk membangun kerajaan chip AI baru.

Di dalam negeri, 36Kr juga belajar dari banyak sumber——Saat ini, pembeli domestik terbesar Nvidia, Alibaba, Byte, dan Baidu, pada dasarnya diam-diam meneliti chip untuk pelatihan model besar.

Kemajuan produk produsen cloud luar negeri, produsen model besar, dan produsen chip bintang, pengumpulan dan pemetaan informasi komprehensif 36 Kr

Namun, chip yang dikembangkan sendiri adalah solusi jangka panjang. Rencana jangka pendek lainnya untuk pelanggan besar ini adalah mencoba produk pesaing Nvidia dan mengurangi ketergantungan mereka pada Nvidia.

AMD adalah Rencana B ini. Orang dalam AMD mengatakan kepada 36Kr,Produk GPU AMD telah membuka pasar pelanggan yang besar di Eropa, Amerika Serikat, Korea Selatan, dan tempat lain——Microsoft telah membeli puluhan ribu produk AMD, dan Tesla, Midjourney, Laboratorium Nasional AS, dan Korea Telecom juga telah menerima pengiriman produk tersebut secara bertahap.

Di China, Chen Wen, karyawan AMD Ecosystem, mengatakan ratusan kartu akselerator AMD model tertentu akan dikirimkan pada tahun 2023. Meski tidak banyak, "namun produk AMD ini hampir belum pernah ditemukan di China sebelumnya."

Menurut perkiraan optimis AMD sebelumnya, GPU pusat data akan menghasilkan pendapatan hingga $2 miliar bagi AMD pada akhir tahun 2024.

Meskipun pasukan semut produsen chip Tiongkok belum menjadi ancaman besar bagi Nvidia, percikan apinya secara bertahap mulai mendapatkan momentum.

36Kr mengetahui bahwa sekarang, penjualan chip pelatihan dan inferensi dalam negeri telah melonjak ke tingkat yang baru - sinyal positif yang menggembirakan adalah bahwa perusahaan Internet dan perusahaan model besar, yang diakui sebagai yang paling sulit untuk memenangkan pesanan di Tiongkok, telah mulai berinvestasi di chip domestik. Pabrikan membuka mulutnya.

Menurut 36Kr, saat ini,Ascend Chip telah berjuang untuk masuk ke sistem perusahaan Internet termasuk Baidu.

Selain itu, perusahaan AI dalam negeri seperti Zhipu AI, MiniMax, dan Step Star semuanya melatih model besar dengan triliunan parameter. Namun, ketika chip kelas atas NVIDIA terbatas, perusahaan model besar umumnya memilih “pelatihan campuran” (yaitu NVIDIA +). chip lainnya), seperti,Cluster Zhipu AI mencadangkan hampir setengah dari chip Shengteng.

Selain itu, produk chip inferensi Tianshu Zhixin dan Suiyuan telah mengirimkan puluhan ribu keping sejak tahun lalu. Saluran pengirimannya mencakup pusat komputasi cerdas domestik utama Chip Kunlun Di sini, pengiriman kumulatif dari dua generasi chip inferensi terakhir adalah 30.000-50.000 buah, dengan pengiriman dari Baidu dan saluran eksternal masing-masing berjumlah setengahnya.

“Harga dan tingkat pasokan Nvidia saat ini berada di ambang batas pengujian apakah dan bagaimana setiap orang dapat melakukannya.”, kata orang dalam industri dengan blak-blakan.


Pendiri NVIDIA Huang Jenxun Sumber Gambar Visual China

Jika menilik lebih jauh dalam tiga hingga lima tahun ke depan, ancaman baru terhadap Nvidia perlahan akan muncul.

Arsitektur chip AI baru selain GPU juga telah muncul di industri - misalnya, perusahaan chip Silicon Valley Groq, yang sebelumnya meluncurkan arsitektur LPU, mengklaim dapat menjalankan model bahasa besar "sepuluh kali lebih cepat" dibandingkan GPU Nvidia;

Ada juga chip Silicon Valley Etched, yang telah merilis chip ASIC model besar, yang diklaim "lebih cepat" daripada GPU Nvidia. Startup chip ini didukung oleh jajaran investasi bintang seperti OpenAI.

36Kr mengetahui bahwa startup chip AI baru telah bermunculan di Tiongkok tahun ini. Misalnya, Shanghai baru-baru ini diam-diam mendukung dua perusahaan chip AI baru.

Yang Gongyifan, CEO Zhonghao Xinying, sebuah perusahaan TPU domestik, mengatakan bahwa tingkat pemanfaatan transistor GPU secara keseluruhan hanya 20%. Faktanya, kekurangannya terlihat jelas, meskipun arsitektur baru seperti TPU dan ASIC tidak terlalu serbaguna , pemanfaatan transistornya adalah Tingkat pemanfaatannya bisa mencapai 60% -100%. "Dalam tiga hingga lima tahun ke depan, pasti akan ada sejumlah besar chip AI di luar arsitektur GPU di dalam dan luar negeri."

Sedikit saja sudah cukup untuk mengguncang raksasa NVIDIA.

"Apakah menurut Anda NVIDIA terlihat tak tertandingi dari luar? Sebenarnya tidak demikian," kata seorang karyawan NVIDIA kepada 36Kr. Seperti yang sering dikatakan Huang Renxun, "Kita hanya punya waktu 30 hari sebelum bangkrut."

NVIDIA telah mempersiapkannya selama lebih dari sepuluh tahun, dan kemudian bertemu dengan perusahaan jenius seperti OpenAI, dan mereka bersama-sama mengkatalisasi keajaiban NVIDIA. Di masa lalu, industri semikonduktor selalu punya cerita tentang cara menyalip raksasa di sudut-sudut.

Asap pertempuran untuk mengepung dan menekan Nvidia telah tersulut.

akhir

akhir