berita

Raksasa Silicon Valley membuat inti, "tiket" adalah US$2 miliar

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"Chip Matters" adalah rencana penelitian industri semikonduktor Tencent Technology. Edisi ini berfokus pada logika dan tantangan perusahaan teknologi yang mengembangkan chip AI yang dikembangkan sendiri.

Penulis Xinchao IC A Niu

Editor Su Yang

“Cadangan chip NVIDIA kami tidak dapat lagi mengimbanginya,” kata seorang CEO dari perusahaan model AI besar.

Dipengaruhi oleh semakin ketatnya kontrol ekspor, sulit untuk membeli chip edisi khusus China seperti A800 dan H800. Sebaliknya, chip tersebut telah digantikan oleh versi H20 yang sesuai. Kinerja yang terakhir telah menyusut secara signifikan, dan kinerjanya telah menurun secara signifikan dunia juga menyebutnya sebagai versi yang dikebiri. Meski begitu, H20 mungkin masih menghadapi pengendalian ekspor dalam pembaruan ketentuan pengendalian ekspor Departemen Perdagangan AS pada bulan Oktober tahun ini.

Financial Times mengutip dua sumber anonim yang dekat dengan Nvidia yang mengatakan bahwa beberapa perusahaan Tiongkok telah memesan chip senilai total US$5 miliar dari Nvidia. Pada saat yang sama, beberapa chip dalam negeri telah memasuki bidang pandang produsen teknologi besar, namun karena proses, interkoneksi, dan alasan lainnya, masih terdapat kesenjangan dalam kinerja dan tantangan pasokan.

Dengan latar belakang ini, banyak perusahaan besar telah memulai penelitian mandiri, dan secara berturut-turut mengembangkan chip TSMC saat ini, yang mencakup beberapa node proses seperti 5nm dan 7nm, untuk memastikan keamanan pasokan chip AI mereka sendiri.

Pengendalian ekspor seperti pedang bermata dua, menghalangi kekuatan komputasi dan membatasi pertumbuhan NVIDIA. Khususnya dalam konteks penelitian mandiri pelanggan, pendapatan NVIDIA di Tiongkok daratan mulai menunjukkan variabilitas. Pada tahun fiskal 2022, pelanggan Tiongkok menyumbang 25% pendapatan pasar Nvidia, namun pada tahun fiskal 2024, proporsi ini turun menjadi satu digit.

Bagi Nvidia, pangsa pasar di Tiongkok daratan menyusut, dan Silicon Valley juga berubah. Pelanggan besar seperti Google, Apple, Meta, Amazon, dan Tesla semuanya mencoba melakukan dua arah, menggunakan chip Nvidia sambil melakukan penelitian mereka sendiri.

Apa logika di balik chip yang dikembangkan sendiri oleh pabrikan besar Tiongkok dan Amerika? Bisakah perusahaan teknologi yang berdatangan ke Laut Merah berhasil mendaratkan chip yang dikembangkan sendiri?

01 Mata uang keras hanya terasa aman saat Anda memegangnya

Dalam kegemaran saat ini terhadap model besar dan AI generatif, chip daya komputasi adalah mata uang utama di tangan perusahaan teknologi. CoreChao IC telah melacak kegilaan dan ketegangan dalam "perebutan daya komputasi" dalam artikel "Arus H100 Harga Setinggi Langit". ke Pasar Gelap".

Memegang kartu di tangan Anda sendiri adalah alasan mendasar mengapa produsen besar mengembangkan chip mereka sendiri.

Menurut Chen Wei, ketua Qianxin Technology, produsen besar memiliki tiga kartu truf: pasokan terjamin, pengurangan biaya, dan penawaran. Secara umum, ini adalah semacam otonomi chip.

Bagi banyak produsen besar Tiongkok, terutama perusahaan Internet dan kecerdasan buatan, mereka dihadapkan pada risiko pengurangan pasokan daya komputasi kapan saja di bawah kendali ekspor chip yang canggih. Penelitian mandiri adalah jaminan keamanan daya komputasi. Namun, chip yang dikembangkan oleh masing-masing perusahaan terutama untuk penggunaan internal, dan spesifikasinya disesuaikan untuk produk mereka sendiri dan bukan produk untuk tujuan umum.

Bagi perusahaan raksasa yang "membakar uang" untuk mengumpulkan daya komputasi, penelitian mandiri adalah cara untuk mengurangi biaya. “Jika volumenya cukup besar dan permintaannya cukup besar, maka pertimbangkan untuk melakukan penelitian mandiri, jika tidak maka hal tersebut mungkin tidak dapat benar-benar mengurangi biaya,” kata Wu Zihao, mantan pakar konstruksi pabrik TSMC.

Pada tahun 2021, Musk meluncurkan superkomputer Dojo yang dibuat dengan chip AI D1 yang dikembangkan sendiri untuk melatih TeslaPilot otomatis sistem. Menurut laporan penelitian terbaru dari Morgan Stanley, sistem ini menghemat total US$6,5 miliar dibandingkan dengan A100 milik Nvidia.

Dengan meningkatnya permintaan AI, ketergantungan Cloud Factory pada GPU jauh melebihi CPU. Permintaan akan chip NVIDIA juga merupakan chip penawaran yang gila-gilaan bagi Cloud Factory untuk menerima pesanan NVIDIA.

Seseorang yang dekat dengan Amazon mengatakan kepada Xinchao IC bahwa kartu NVIDIA tidak murah. Jika produsen DSA besar memiliki chip khusus yang dikembangkan sendiri, mereka tidak hanya dapat sepenuhnya mengurangi biaya rata-rata chip dan paten, tetapi mereka juga akan mampu. untuk bersaing lebih baik dengan NVIDIA.

Informasi publik menunjukkan bahwa Amazon tidak hanya merancang server komputasi, server penyimpanan, dan routernya sendiri, tetapi juga mengembangkan chip server Graviton sendiri.

AWS meluncurkan prosesor Graviton4 universal

Menurut The Information, Amazon terus menurunkan harga dengan mengganti Nvidia dengan Graviton. Pelanggan yang menyewa server Graviton secara langsung menghemat 10% hingga 40% biaya komputasi. Dari sudut pandang Nvidia, jika Anda ingin mempertahankan Amazon, pelanggan pabrik cloud terbesar di dunia, Anda harus duduk di meja poker dan menegosiasikan harga yang lebih baik.

"Konsesi keuntungan semacam ini terkadang tidak sepenuhnya tercermin dalam diskon, namun mungkin tercermin dalam alokasi."

Menurut orang dalam yang disebutkan di atas, sebagai produsen terkemuka dunia, jika Nvidia secara langsung memberikan diskon yang sangat intuitif pada harga satuan, hal itu akan berdampak negatif besar pada sistem penetapan harga produk dan tidak kondusif bagi perlindungan harga produk , mereka dapat meningkatkan peralatan interkoneksi, Meningkatkan penyimpanan SSD, menambahkan lebih banyak konfigurasi Rak, dll. untuk memberikan diskon kepada pelanggan besar yang menyamar.

Ada juga metode preferensial yang lebih umum - kemiringan kapasitas dan pemberian hak pertama kali.

Dengan keunggulan penggerak pertama, Amazon dapat menetapkan harga mesin lengkap lebih tinggi dalam jangka pendek, dan "menghemat" (diskon) uang dari premi mesin lengkap dan sirkulasi rantai alat perangkat lunak pendukung.

Selain memastikan pasokan, mengurangi biaya, dan melakukan penawaran, beberapa produsen besar ingin memastikan daya saing unik mereka dengan mengembangkan chip mereka sendiri.

Chen Jing, wakil presiden Fengyun Society, menyebutkan bahwa chip yang dijual oleh NVIDIA cocok untuk komputasi umum dan memiliki fungsi lengkap tetapi juga relatif mahal. Namun, beberapa pelanggan hanya memerlukan fungsi khusus untuk meningkatkan keunggulan tertentu , mereka akan mempertimbangkan Belajar mandiri.

“Saya hanya perlu melakukan inferensi model besar dan tidak memerlukan fungsi pelatihan. Dalam hal ini, saya dapat merancang chip khusus dengan fungsi sederhana, tetapi kecepatan lebih cepat dan harga lebih murah,” kata Chen Jing. “Perusahaan besar seperti Google dan Microsoft memiliki spesifikasi sistem perangkat lunak dan perangkat kerasnya sendiri. Bagaimana cara mengontrol kebisingan dan tingkat konsumsi energi yang harus dicapai. NVIDIA mungkin tidak dapat memenuhi standar. Akan lebih mudah untuk mendesain sendiri. "

Di antara raksasa Silicon Valley, Google sangat memperhatikan diferensiasi arsitektur, biaya, dan teknologi chip miliknya. Google telah mengembangkan unit pemrosesan tensor AI (TPU) sejak tahun 2016 untuk mencapai efektivitas biaya yang lebih baik dalam pelatihan skala besar dan menengah. dan inferensi. dan kinerja untuk memastikannyakomputasi awanProduk mempunyai keunikan dan pengakuan yang lebih baik.

Google meluncurkan TPU "Trillium" generasi keenam

Menurut data terkait TPU generasi ke-4 yang diungkapkan oleh Google, dibandingkan dengan sistem berukuran sama, TPU v4 1,7 kali lebih efisien dibandingkan NVIDIA A100 dan 1,9 kali lebih hemat energi.

Selain poin-poin di atas, dari sudut pandang ekologi, ada alasan yang lebih dalam – untuk mematahkan monopoli CUDA. Sebagai bahasa pemrograman yang dikembangkan oleh NVIDIA, CUDA menjadi alasan utama mengapa harga GPU "dinaikkan ke langit" dan pelanggan harus menerimanya.

Jika pabrik cloud tidak melakukan riset mandiri, meskipun bisa mendapatkan harga pesanan yang bagus, lebih dari 95% prosesor di pusat data akan tetap menggunakan GPU NVIDIA, dan seluruh permintaan cloud AI akan tetap bergantung pada CUDA. ekosistem. Pada analisa terakhir, nasib Nvidia ada di tangan Nvidia.

Ketika Cloud Factory melengkapi pusat data dengan chip yang dikembangkan sendiri dan mengembangkan banyak middleware dan fungsi terjemahan biner yang mendasarinya untuk membantu pelanggan bermigrasi ke ekosistemnya sendiri, Cloud Factory akan memiliki tingkat kompatibilitas setara yang lebih tinggi dengan program CUDA dan ketergantungan eksklusifnya akan berkurang secara bertahap.

"Inilah yang dilakukan semua pabrik cloud. Sekalipun prosesornya mungkin berjumlah kurang dari 4% dari keseluruhan pusat data, mereka tetap harus bersikeras melakukan hal ini."

02 Kalau ada orang dan uang, ayo kita akhiri

“Ada orang, uang, benda, dan pada saat yang sama masih memiliki potensi masa depan, sehingga bisa diakhiri.”

 

Yu Hao, wakil presiden Legend Holdings, percaya bahwa logika produsen besar yang melakukan penelitian mandiri terhadap chip relatif lancar. Pelanggannya ada di sana, yang merupakan keuntungan yang jelas.

"'Orang-orang' tersebut haruslah orang-orang yang 'berbakat' dengan pengalaman praktis di seluruh siklus hidup chip, dan 'uang' tersebut haruslah 'uang hidup' yang terus memberikan kontribusi pendapatan berdasarkan bisnis tenaga komputasi. Dengan cara ini, besar produsen dapat mengandalkan loop tertutup bisnis AI untuk memperhitungkan prospek masa depan. Dengan pertumbuhan pasar yang diharapkan, permintaan akan daya komputasi telah diukur, dan koordinasi strategis antara manusia dan uang telah selesai, chip yang dikembangkan sendiri telah selesai. telah terjadi secara alami,” kata Yu Hao kepada Xinchao IC.

Namun, biaya masuk untuk duduk di meja poker yang dikembangkan sendiri dimulai setidaknya US$2 miliar. Pada awal tahun ini,Buka AI CEO Sam Altman bahkan dikabarkan memiliki rencana gila untuk mengumpulkan $7 triliun untuk membangun chip, meskipun orang yang terlibat kemudian membantah rumor tersebut.

Menurut seseorang yang mengetahui masalah ini, "Setiap perusahaan yang melakukan iterasi pada produk generasi pertamanya akan menelan biaya setidaknya US$2 miliar untuk meningkatkan produksi massal jika dihitung berdasarkan node perantara berukuran 7 nanometer."

Selain itu, chip yang dikembangkan sendiri sebagian besar untuk digunakan sendiri dan tidak perlu mempertimbangkan sulitnya membangun ekosistem. Ran Ciyuan mengutip mitra dari Sky Eagle Capital yang mengatakan: "Desain arsitektur chip tujuan khusus umumnya tidak perlu terlalu rumit, karakteristik penerapannya juga sangat jelas, dan pengembangannya relatif cepat. Oleh karena itu, bagi banyak orang Internet perusahaan, pengembangan chip tujuan khusus mereka berada pada skenario yang jelas, Anda tidak perlu menghabiskan terlalu banyak uang dan waktu untuk mengembangkan ekosistem perangkat lunak, dan proses IP juga sudah matang.”

Teorinya berhasil, tapi bagaimana kita bisa membuat belajar mandiri berhasil?

Menurut pengetahuan industri, penelitian mandiri chip dapat dibagi menjadi bagian front-end dan back-end. Front-end adalah desain logis, yang merupakan fungsi paling dasar dari sebuah chip. Back-end adalah desain fisik, yang merupakan entitas yang mengimplementasikan semua fungsi ke dalam sirkuit dan menyalurkannya.

Diagram skema proses chip yang dikembangkan sendiri

Secara umum, satu-satunya desain yang dapat diselesaikan oleh tim kecil secara mandiri adalah bagian depan dan belakang chip logika serta rantai alat perangkat lunak itu sendiri, namun meskipun demikian, banyak desain hanya memiliki 5% sirkuit khusus yang dikembangkan sendiri.

Orang yang mengetahui masalah tersebut mengatakan, “Setiap orang di pasar melakukan 1/5 sendiri dan meminta orang lain untuk melakukan 4/5 sisanya. Ini adalah ekosistem yang cukup matang. Adapun cara mendapatkan IP sirkuit ini, ada yang sudah selesai saluran yang buruk, dan ada pula yang melalui saluran yang buruk. Saluran yang sesuai, seperti lisensi dari produsen desain IP seperti ARM.”

Bagi banyak tim, mereka sebenarnya memiliki kemampuan untuk merancang beberapa sirkuit secara mandiri, tetapi karena mereka perlu mengatasi IP yang memiliki perlindungan kekayaan intelektual yang sangat ketat, meskipun dibuat, kemungkinan besar akan melanggar arsitektur komputer dan tidak dapat digunakan, atau bahkan melanggar IP orang lain, ini juga merupakan rintangan pertama yang dihadapi produsen dalam negeri ketika mengembangkan chip mereka sendiri.

Ada juga beberapa hal yang tidak dapat dirancang oleh tim riset mandiri, seperti beberapa struktur NOC (Network on Chip) yang sangat sulit.

Desain hanyalah sebagian dari chip yang dikembangkan sendiri. Ini juga mencakup tape-out, produksi massal, dll. Anda mungkin mengalami berbagai masalah dalam prosesnya, termasuk kegagalan tape-out, kapasitas produksi massal, dll., tetapi ini bukan masalah mandiri. -berkembang dan pada akhirnya juga perlu menyelesaikan serangkaian permasalahan pendukung, termasuk bagaimana menerapkan integrasi rantai industri.

Dari perspektif dunia luar, chip logika khusus berukuran sekitar 500mm², dan GPU tujuan umum bisa berukuran 800mm², berisi puluhan miliar atau bahkan ratusan miliar transistor dianggap sebagai prosesor vektor. Namun, untuk diimplementasikan dalam skenario aplikasi, hal ini juga memerlukan desain dan implementasi penyimpanan, pengendalian konsumsi energi, pasokan daya, dan kondisi pengoperasian mesin secara keseluruhan. Hal ini juga memerlukan interkoneksi dan jaringan untuk membentuk cluster yang lebih besar.

Selain itu, tujuan akhir produk adalah untuk menciptakan diferensiasi, yang perlu dilakukan pada antarmuka periferal dan keseluruhan mesin, dan SKU yang berbeda akan muncul. Industri biasanya membandingkan penyimpanan, konsumsi energi, dan efisiensi ukuran luas dari perspektif seluruh mesin.

Dengan kata lain, selain integrasi rantai industri dan masalah IP, chip yang dikembangkan sendiri juga harus mempertimbangkan SKU produk. Mendesain chip logika saja tidak cukup.

Seorang senior yang tidak ingin disebutkan namanya mengatakan kepada Xinchao IC, “Banyak perusahaan dalam negeri tidak memiliki kemampuan desain produk. Setelah membuat chip, mereka harus pergi ke berbagai tempat untuk pengujian .setiap hari.Pusat data dari produsen besar berharap pihak lain dapat meninggalkan soket pada motherboard server baru untuk diri mereka sendiri. Jika pengujian berhasil, mereka akan membeli batch.

Produksi massal merupakan tantangan lain selain desain, tape-out, dan produksi. Tim kecil harus mempertimbangkan apakah mereka bisa memesan kapasitas produksi?

“Output selalu menjadi angka yang sangat penting bagi pabrik Fab.” Wu Zihao, mantan pakar konstruksi pabrik TSMC, mengatakan bahwa produsen harus memahami hubungan mana yang mereka masuki dan berapa banyak output yang mereka janjikan.

Pabrikan tingkat pertama pada dasarnya telah memesan kapasitas produksi terbaru dari pabrik Fab selama tahap DTCO (Design Technology Collaborative Optimization). Saat ini, tim desain top dunia, seperti ARM, memiliki banyak orang yang ditempatkan di TSMC setiap tahun, termasuk banyak produsen EDA.

DTC menentukan indikator kinerja prosesor generasi berikutnya pada node tertentu, seperti berapa banyak uang yang dapat dihemat dan berapa banyak kinerja yang dapat ditingkatkan melalui desain tata letak yang wajar pada node 3nm.

"NVIDIA dan Apple selalu bersedia menguji proses manufaktur paling canggih. Selama TSMC hadir dengan proses manufaktur mutakhir, meskipun hasilnya tidak diketahui dan peningkatan kinerja tidak diketahui, sebelum model ekonomi dapat melakukannya Jika dihitung, mereka sudah memesan kapasitas produksi. Desain kolaboratif DTCO dengan pabrik Fab adalah alasan mendasar bagi produsen lapis pertama untuk mendapatkan kapasitas produksi,” kata Wu Zihao.

Jika tidak ada desain kolaboratif sejak awal, maka pabrik Fab dan tim Fabless, Pihak A dan Pihak B, harus berganti peran. Karena tidak ada yang berani menggunakannya, pabrik Fab hanya dapat mempromosikan proses barunya sedikit demi sedikit , dimulai dengan proses dengan risiko paling rendah.

Misalnya chip mesin penambangan memiliki struktur yang sangat sederhana dan ukuran yang sangat kecil, sehingga sangat cocok untuk pengujian awal. Pelanggan pertama chip 3nm Samsung adalah pabrik peralatan pertambangan dari China.

Wu Zihao berkata, "Setelah pabrik Fab berhasil menguji air dengan pesanan pelanggan dalam jumlah kecil, pabrik tersebut kemudian dapat mencoba memproduksi secara massal CPU PC, chip ponsel, dan akhirnya chip AI, selangkah demi selangkah."

Saat ini, produsen besar dalam negeri telah menginvestasikan setidaknya miliaran dolar pada chip yang dikembangkan sendiri. Jika sebuah perusahaan rintisan ingin memasuki dunia ini, perusahaan tersebut harus memiliki pelanggan awal yang cukup atau memiliki platform aplikasi yang mendukung adaptasi chip dan uji coba, atau harus memiliki modal yang cukup atau kemampuan pembiayaan yang kuat dipenuhi.

Chen Wei mengatakan kepada Xinchao IC bahwa jika itu adalah perusahaan komersial tanpa cadangan tenaga kerja berbiaya rendah dan tidak bergantung pada sekolah atau lembaga penelitian, maka akan memerlukan pembiayaan tidak kurang dari RMB 500 juta hingga RMB 1 miliar sebelum produksi massal; adalah lembaga penelitian atau lembaga penelitian, Dengan dukungan lain, biaya tenaga kerja dapat dikurangi secara signifikan, dan ambang batas moneter dapat sedikit lebih rendah.

“Kalau tidak punya uang sebanyak itu, tapi startup ini punya kemampuan pengendalian biaya yang sangat kuat, bisa memanfaatkan kolaborasi hulu dan hilir secara maksimal untuk menekan biaya. Semuanya untuk menjamin kelanjutan riset dan pengembangan produk.”

Dalam hal prioritas pemilihan Fab, menurut orang yang mengetahui masalah tersebut, startup pada awalnya akan memilih untuk memesan kapasitas produksi TSMC, diikuti oleh GlobalFoundries, tetapi GlobalFoundries tidak memiliki proses dan pengemasan yang canggih, dan kemudian mereka akan beralih ke SMIC, tetapi SMIC Semua kapasitas produksi yang dapat dipesan secara internasional telah dijadwalkan pada tahun berikutnya.

Terkait dengan situasi ini, lembaga investasi mengambil perspektif jangka panjang.

Yu Hao mengatakan bahwa untuk chip kelas atas yang dikembangkan sendiri di dalam negeri, tidak dapat dihindari untuk menghadapi hambatan dalam jangka pendek. Jangka panjang bergantung pada kecepatan evolusi pemolesan lini proses lanjutan dan perluasan kapasitas yang diwakili oleh SMIC terutama bergantung pada sirkulasi internal. Namun, produsen dengan kemampuan desain chip kelas atas mungkin ingin mempertimbangkan untuk pergi ke luar negeri dan menggunakan sirkulasi eksternal untuk mendorong sirkulasi internal. Keluar akan membuka masa depan yang lebih cerah.

03 Tidak mudah menjadi “penggali kubur” Nvidia

Pelanggan lama mendirikan bisnis mereka sendiri, dan Nvidia selalu menjadi pihak yang dirugikan.

Gelombang penelitian mandiri global ini semakin meningkat dibandingkan sebelumnya. Selain hasil riset mandiri yang matang seperti Google TPU dan Amazon Graviton. Baru-baru ini, seluruh lingkaran teknologi dilanda "Sohu, chip AI pertama di dunia yang didedikasikan untuk Transformer".

Startup chip AS, Etched, meluncurkan chip AI khusus Transformer, Sohu

Chip ini secara langsung menyematkan arsitektur Transformer ke dalam chipnya, dan kinerjanya jauh melebihi GPU dan chip kecerdasan buatan umum lainnya. Chip ini diklaim 10 kali lebih kuat daripada B200, chip terbaik yang baru diluncurkan pada tahun 2017. Maret tahun ini. Server yang dilengkapi dengan 8 chip Sohu dikabarkan memiliki kinerja yang sebanding dengan cluster 160 GPU H100 dan dapat memproses hingga 500,000 token Llama 7B per detik.

"Ayam goreng populer" lahir, dan pabrik Fab serta mitranya merasa senang.

Dilaporkan bahwa perusahaan telah bekerja sama secara langsung dengan proses 4nm TSMC untuk produksi chip Sohu, dan telah memperoleh pasokan HBM dan server yang memadai dari pemasok terkemuka. Beberapa pelanggan awal telah memesan perangkat keras senilai puluhan juta dolar dari perusahaan. Netizen memberi julukan pada Etched - "Penggali Kuburan Nvidia".

Namun apakah mitos “penelitian mandiri” NVIDIA akan hancur karena meningkatnya asap? sebenarnya tidak.

Dalam industri semikonduktor, ada "siklus Mr. Ben" yang terkenal - jenis chip secara teratur berevolusi antara generalisasi dan penyesuaian - dalam periode tertentu, struktur umum terjual paling baik dan populer di kalangan pengguna, tetapi setelah mencapai tahap tertentu , struktur dengan tujuan umum tertinggal dalam menanggapi kebutuhan spesifik, dan struktur dengan tujuan khusus akan menjadi populer.

Dan NVIDIA berhak mewakili era arsitektur universal, yang masih berada pada puncaknya.

Menurut statistik dari Wells Fargo, NVIDIA saat ini menguasai 98% pasar akselerasi AI pusat data global dan berada dalam posisi dominan mutlak. Ini berarti bahwa 98% populasi dunia menggunakan CUDA C NVIDIA untuk “memeras” kinerja semua GPU, dan hanya 2%-3% orang yang tersisa masih bersikeras menggunakan “palu” yang buruk, untuk melakukan hal yang sama. "paku".

“Sekarang, baik Amazon atau Intel, prosesor yang mereka buat sendiri tidak dapat memenuhi maksimalisasi kepentingan vendor cloud secara ekonomi, sehingga mereka pasti akan terus menggunakan chip NVIDIA dalam jumlah besar hingga suatu saat NVIDIA benar-benar kehilangan keunggulannya. spesialisasi peternakan, kata orang yang mengetahui hal tersebut.

Namun, berbaring tidak sejalan dengan kepribadian NVIDIA. Huang Renxun adalah orang yang mengetahui "lahir dalam kesedihan dan mati dalam kebahagiaan". , atau tidak Saat Anda dijadikan makanan oleh orang lain, Anda sering kali tidak tahu situasi apa yang Anda hadapi, tetapi tetap berlari apa pun yang terjadi.”

Kali ini, menghadapi tantangan penelitian mandiri di seluruh Silicon Valley, Nvidia juga mengambil risiko.

Orang senior yang disebutkan di atas mengatakan kepada Xinchao IC, “Nvidia bukan lagi GPU serba guna. Di unit GPU-nya, Anda dapat melihat sejumlah besar Tensor Cores untuk menyelesaikan penghitungan matriks mesin, dll., baik dalam hal struktur perangkat keras atau pembaruan operator perangkat keras, NVIDIA mendorong dirinya menuju tren desain berbasis DSA setiap tahun.”

DSA (Arsitektur Khusus Domain) adalah arsitektur prosesor yang dapat diprogram dan disesuaikan untuk bidang tertentu, yang dapat mengoptimalkan kinerja dan efektivitas biaya aplikasi tertentu. Saat ini, Google, Tesla, OpenAI, dan Cerebras telah meluncurkan chip DSA mereka sendiri untuk aplikasi tertentu.

Menurut orang-orang yang mengetahui masalah ini, semua produsen DSA akan menemukan bahwa meskipun Nvidia tidak memodifikasi perangkat keras dan GPU tujuan umum hanya memperbarui satu operator, keunggulan produsen DSA akan hilang sepenuhnya. Tampaknya dibandingkan dengan NVIDIA, tidak hanya area chip logikanya yang tidak cukup besar, kapasitas dan kecepatan perangkatnya juga tidak cukup besar, daya komputasinya tidak sebaik NVIDIA, dan kemampuan adaptasi perangkat lunaknya kurang baik apa yang dihadapi semua produsen DSA. Masalahnya - Siklus Muben awalnya akan beralih ke arsitektur dan penyesuaian khusus domain DSA, tetapi sekarang telah kembali ke era prosesor tujuan umum.

Selain "bercermin" dengan produsen DSA, Nvidia juga telah memperluas cabang zaitun ke penelitian mandiri. Pada awal tahun 2024, Nvidia mendirikan departemen bisnis baru, dipimpin oleh veteran semikonduktor Dina McKinney, khusus untuk komputasi awan, telekomunikasi 5G. , dan permainan. Kami membuat chip khusus untuk pelanggan di bidang otomotif, mobil, dan bidang lainnya.

Reuters mengutip orang-orang yang mengetahui masalah ini yang mengatakan bahwa para eksekutif Nvidia telah bertemu dengan perwakilan dari Amazon, Meta, Microsoft, Google dan OpenAI untuk membahas chip khusus untuk mereka. Selain chip pusat data, perusahaan juga berupaya untuk mendapatkan telekomunikasi, otomotif dan klien video game.

Sebelumnya, dikabarkan bahwa versi baru konsol game Nintendo Switch yang diluncurkan oleh Nintendo tahun ini kemungkinan akan dilengkapi dengan chip khusus NVIDIA. NVIDIA juga memiliki kehadiran yang kuat di pasar perangkat genggam dan telah meluncurkan chip seluler seri Tegra. Meskipun seri chip ini pada akhirnya tidak menempati tempat di pasar perangkat seluler.

Di pasar yang didominasi oleh efektivitas biaya, tidak mudah untuk menjadi penggali kubur Nvidia. Sebagian besar penggali kubur sebelumnya gagal - mereka mungkin akhirnya diakuisisi. Misalnya, Intel dan Google mengakuisisi banyak startup, tetapi sebagian besar perusahaan lain bahkan tidak menunggu akuisisi dan langsung mati.

Mungkin akan lebih mudah bagi start-up untuk sukses jika mereka mengubah perspektifnya.

“Misalnya, jangan terobsesi dengan prosesor AI itu sendiri. Daripada menghabiskan banyak waktu untuk memenuhi cita-cita DSA, lebih baik mempertimbangkan solusi tingkat sistem. Misalnya, periferal bisa dibuat untuk menyediakan layanan untuk prosesor AI, dan penyimpanan profesional, Sensor profesional juga dapat mencapai tujuan yang sama," kata orang yang mengetahui masalah tersebut.

Pada tahun 2019, Nvidia mengumumkan akan mengakuisisi Mellanox senilai US$6,9 miliar. Valuasi ini sangat tinggi sehingga Nvidia hampir menarik seluruh arus kasnya secara berlebihan.

Perusahaan ini tidak mengembangkan port atau modul fotovoltaik, juga tidak mengembangkan sakelar sendiri. Perusahaan ini hanya membuat satu produk - PHY "InfiniBand" untuk interkoneksi berkecepatan tinggi antara lapisan bawah sakelar dan lapisan bawah komunikasi. Bagi Nvidia, yang saat itu sangat ingin mendobrak batasan interkoneksi server, ini adalah persyaratan periferal yang sangat penting. Tidak peduli seberapa bagus NVLink pada saat itu, NVLink selalu terkunci pada satu mesin. Namun InfiniBand dapat memungkinkan switch untuk menerobos hambatan interkoneksi antar server dan menghubungkan semua GPU ke dalam cluster besar.

Melihat situasi saat ini, situasi dalam negeri sedang booming, dan chip yang dikembangkan sendiri harus terbang untuk sementara waktu. Chen Wei percaya bahwa membangun sebuah game bukanlah hal yang buruk, tetapi membangun sebuah game kelas atas perlu dilakukan agar tidak melewatkan periode kritis untuk pengembangan industri.

Zhou Jiangong, pendiri Unfinished Research, memperluas pandangan ini lebih jauh. Ia percaya bahwa penerapan di masa depan akan memerlukan chip AI yang profesional, dapat disesuaikan, dan dibuat dalam skala mini yang akan melebihi permintaan model-model dasar yang besar dan mutakhir. Melatih model open source, model yang lebih kecil dengan biaya lebih rendah, atau menyempurnakan dan menyaring model besar, serta inferensi, semuanya memberikan ruang luas untuk chip yang dikembangkan sendiri. Selain itu, dalam perubahan yang cepat dan tahap teknologi baru yang belum matang, akan ada banyak peluang penelitian mandiri seputar aplikasi di atas.

“Jangan melakukan hal-hal yang mengakhiri Nvidia, tetapi lakukan lebih banyak hal selain Nvidia.”