berita

NVIDIA sudah memasuki masa sulit, kenapa kita masih optimis?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teks |. Shidao, penulis |. Shidao AI Group, editor |

NVIDIA mengalami masalah baru-baru ini, dan ini adalah masalah besar.

Yang pertama adalah "agresi asing". Karena "langkah kecil" yang terus-menerus, perusahaan tersebut menghadapi penyelidikan antimonopoli oleh Departemen Kehakiman AS.

Yang kedua adalah "kekhawatiran internal". Karena kesalahan desain produk, waktu pengiriman chip Blackwell baru akan tertunda tiga bulan.

Minggu lalu, harga saham Nvidia naik turun - pada hari Selasa, turun 7%; pada hari Rabu, melonjak hampir 13%; pada hari Kamis, ditutup turun hampir 7% pada hari Jumat, turun 7% dalam satu hari;Bahkan dalam hal volatilitas, Nvidia telah melampaui Bitcoin.Opsi 30 harinya menyiratkan volatilitas baru-baru ini melonjak dari 48% menjadi 71%, sementara indeks Bitcoin DVOL turun dari 68% menjadi 49%.

Dana lindung nilai terkenal Elliott mengatakan kepada investor: Nvidia berada dalam "gelembung" dan teknologi AI telah dilebih-lebihkan. Badan tersebut mengatakan bahwa pelanggan terbesar Nvidia sedang mengembangkan chip mereka sendiri dan meragukan apakah raksasa tersebut akan terus membeli GPU Nvidia dalam jumlah besar. Kapan gelembung itu akan pecah? Elliott percaya bahwa jika hasil keuangan Nvidia buruk, perpecahan bisa terjadi.

Tidak dapat dipungkiri bahwa Nvidia sedang memasuki "masa sulit", namun masih terlalu dini untuk "diperangi dari semua sisi".

Pengawasan secara khusus menargetkan “tujuh inci” NVIDIA, yang stabil namun tidak kejam

Pada awal Juli, Prancis melancarkan serangan antimonopoli pertama terhadap NVIDIA. Pada minggu-minggu berikutnya, Nvidia juga menjadi sasaran Departemen Kehakiman AS.

Informasi tersebut melaporkan bahwa penyelidik dari Departemen Kehakiman AS mengunjungi rumah “lawan” dan “pelanggan” Nvidia untuk mengumpulkan tuduhan semua orang.

Tuduhan 1: NVIDIA mengancam pelanggan.Saat Anda membeli chip AMD, Nvidia mungkin menaikkan harga untuk Anda, atau bahkan mengurangi pengiriman GPU yang dijanjikan sebelumnya.

Tuduhan 2: Nvidia memaksa distribusi kabel dan rak jaringan.Penderita terbesarnya antara lain: Microsoft, Google, Amazon...

Suatu ketika, untuk mendapatkan hak pengiriman prioritas, Microsoft mengertakkan gigi dan membeli kabel jaringan Nvidia. Ketika rekening diselesaikan pada awal tahun 2023, diketahui bahwa 1/3 dari uang yang dibayarkan ke Nvidia dihabiskan untuk produk "edge" ini. . Dilaporkan bahwa penjualan kabel jaringan Nvidia meningkat lebih dari tiga kali lipat menjadi $3,2 miliar, menyumbang 14% dari total pendapatan pusat datanya.

Hari ini, Wakil Presiden Nvidia Andrew Bell juga mengatakan: "Siapa pun yang membeli rak tersebut akan mendapat prioritas untuk mendapatkan GB200."
Microsoft lolos dari bencana setelah berminggu-minggu "pertengkaran"; sementara Amazon dan Google sama-sama setuju karena paksaan mereka.

Tuduhan Ketiga: Nvidia mengakuisisi Run:ai.Transaksi tersebut resmi diumumkan pada akhir April tahun ini, dengan harga pembelian US$700 juta.

Run:ai adalah startup Israel yang berfokus pada penyederhanaan aplikasi AI dan beban kerja pada GPU, sehingga membuat chip AI lebih efisien, yang pada gilirannya membantu mengurangi jumlah GPU Nvidia yang dibutuhkan untuk menyelesaikan tugas.

Integrasi fungsionalitas Run:ai oleh Nvidia ke dalam produk yang sudah ada tidak hanya "membunuh" kemungkinan penggunaannya oleh lawan,Mereka juga meningkatkan jangkauan DGX dan DGX Cloud.

Lao Huang Zaoyun adalah "'retret yang baik' bagi NVIDIA untuk menghindari menjadi Cisco." Salah satunya adalah bisnis cloud dan perangkat lunak menghasilkan miliaran dolar setiap tahunnya. Yang kedua adalah bahwa Nvidia memiliki “semua tuas” untuk mengembangkan layanan yang melengkapi chipnya.

Baik itu "mengalokasikan GPU secara ketat", "terlibat dalam distribusi barang dan jual beli paksa", dan "membangun cloud dan ekosistem", ini semua adalah "langkah sulit" Huang Renxun untuk mengkonsolidasikan kerajaan NVIDIA di jangka panjang. Lagipula, tujuannya adalah agar setiap perusahaan di dunia... akan menggunakan Nvidia AI Enterprise.

Oleh karena itu, penyelidikan yang dilakukan oleh Departemen Kehakiman AS ini dapat digambarkan sebagai "stabil dan akurat" dan mencapai "tujuh inci" Nvidia.

Tapi "bersikap kejam atau tidak" adalah soal lain. Lagi pula, investigasi antimonopoli sering kali memakan waktu bertahun-tahun, dan pemerintah pada akhirnya mungkin tidak mengajukan tuntutan terhadap perusahaan target. Sekalipun litigasi telah dimulai, kasus ini mungkin akan memakan waktu bertahun-tahun sebelum diselesaikan.

Misalnya, kasus antimonopoli penelusuran Google tahun 2020 baru diadili tahun ini, dan hakim yang bertanggung jawab atas kasus tersebut belum mengambil keputusan.

Kesimpulannya, meskipun investigasi antimonopoli ini dilakukan dengan sengit dan cepat, tampaknya hal tersebut tidak dapat merusak fondasi kerajaan GPU.

Dua dampak langsung diperkirakan terjadi pada Nvidia.

Pertama, hal ini mempengaruhi akuisisi di masa depan. Misalnya, pada tahun 2021, FTC mengajukan gugatan atas dasar antimonopoli untuk mencegah Nvidia menghabiskan $40 miliar untuk mengakuisisi Arm dari SoftBank. Kalau dilihat sekarang, Masayoshi Son bisa hidup kembali berkat FTC.

Yang kedua adalah menindak "perjanjian tuan". Bagaimanapun, itu telah menjadi sasaran, dan "langkah kecil" Nvidia mungkin tertahan.

Nvidia gemetar, dan perkembangan AI global melambat

Mari kita bicara tentang “masalah internal” produk Nvidia.

Menurut laporan,Karena cacat desain, model NVIDIA B100 dan B200 dibatalkan. Model yang dipesan sebelumnya dikirimkan dengan jumlah 20% dari jumlah pesanan, dan kemudian ditingkatkan menjadi B200A. Pengiriman diharapkan dimulai pada pertengahan tahun depan.

Namun, kemajuan GB200 belum tertunda saat ini. GB200 "raja terkuat" bukan hanya sebuah chip, tetapi platform kuat yang menggabungkan dua chip B200. (1 GB200 memiliki 1 Grace CPU + 2 B200).

Permintaan pasar terhadap B100 sendiri dilaporkan tidak besar, dan pelanggan sudah beralih dari B100 ke B200 (permintaan lebih dari 450.000 unit).

Dilihat dari masukan dari beberapa institusi, solusi saat ini adalah menggunakan H200 untuk mengisi kesenjangan tersebut terlebih dahulu.Nvidia terutama akan meluncurkan H200 pada kuartal ketiga, dan akan menambahkan beberapa H200 ke pelanggan pada bulan Oktober dan November, dan semuanya akan normal paling lambat pada bulan Desember.

Penundaan ini akan mengganggu rencana penerapan pelanggan besar seperti Meta, Google, dan Microsoft, serta dapat memengaruhi kemajuan pengembangan produk dan layanan yang mengandalkan chip AI Nvidia, termasuk AI generatif, pemrosesan video, dan aplikasi AI lainnya.

Dengan kata lain, meskipun para analis meneriakkan "gelembung NVIDIA", begitu sesuatu terjadi pada NVIDIA, proses pengembangan AI global akan melambat.

Artinya, jika Anda ingin membuktikan bahwa gelembung NVIDIA akan segera meledak, atau untuk membuktikan bahwa gelembung AI akan segera meledak; atau untuk membuktikan bahwa permintaan pasar akan GPU sedang melambat atau untuk membuktikan bahwa NVIDIA sedang bersaing produk mulai bersinar.

Tapi saat ini, Anda tidak bisa memberikan bukti adanya pukulan.

Mengapa Anda optimis pada Nvidia

Pertama, apakah gelembung AI akan meledak? TIDAK.

Sebagai bos yang paling "pesimis", "Profesor Dalong" Daron Acemoglu, dewa publikasi internasional terkemuka, percaya bahwa dalam 10 tahun ke depan, AI akan meningkatkan produktivitas sekitar 0,53% hingga 0,66%, dan meningkatkan PDB sekitar 0,9%.

Jim Covello, kepala penelitian ekuitas global di Goldman Sachs, juga cukup pesimistis: AI harus mampu memecahkan masalah kompleks sebelum pendapatannya melebihi pengeluarannya, yaitu sekitar US$1 triliun.Mengenai gelembung AI, Covello berpendapat mungkin perlu waktu lama untuk meledak.

Pada saat yang sama, Morgan Stanley dan “TMT King” Coatue di Wall Street sangat optimis terhadap prospek AI.

Morgan Stanley percaya bahwa ledakan investasi infrastruktur AI saat ini masih dalam tahap awal dan belum mencapai tingkat gelembung Internet pada tahun 1999. Investasi GPU, khususnya, baru saja dimulai.

Coatue percaya bahwa AI bukanlah sebuah hype, dan masa keemasan belum tiba; AI bukanlah sebuah gelembung penilaian, namun pada dasarnya adalah permainan untuk para raksasa.

Kedua, apakah GPU sudah penuh? TIDAK.

Inilah pertarungan antara Sequoia dan a16z.

Sequoia "menjelek-jelekkan" GPU, percaya bahwa puncak kekurangan pasokan telah berlalu, dan menghitung bahwa kesenjangan pendapatan industri AI akibat pembelian GPU mencapai US$500 miliar.

a16z, di sisi lain, tidak hanya menghabiskan ratusan juta dolar untuk menyimpan ribuan GPU, tetapi juga meluncurkan "Proyek Oksigen" dengan cara yang terkenal, yang pada akhirnya berencana untuk memperluas ukuran cluster GPU menjadi lebih banyak lagi. dari 20.000 unit.

Bagaimana cara praktisnya? Bagaimana kalau kita mengubah pemikiran kita.

Pemikiran konvensional - modelnya kuat dan aplikasi mematikan muncul - semakin besar permintaan daya komputasi - semakin tinggi permintaan GPU.

Namun sebaliknya jika kita analogikan antara era AI dan era Internet. Dapat disimpulkan bahwa Internet adalah jaringan komputer, dan model AI adalah komputer yang terhubung ke jaringan tersebut. Layaknya setiap orang yang memiliki PC dan smartphone, beragam model AI akan bermunculan di era AI, dan semuanya akan membentuk ekosistem yang utuh.

Oleh karena itu, era AI membutuhkan daya komputasi yang lebih besar. Namun saat ini biaya daya komputasi terlalu tinggi dan langka, yang selanjutnya mempengaruhi kemajuan pengembangan AI. Hal ini terlihat dari gemetarnya NVIDIA dan melambatnya perkembangan AI global.

Lebih jauh lagi, meski kita tidak melihat jangka panjangnya, kita hanya melihat jangka pendeknya. Dari pelatihan hingga inferensi, terdapat permintaan daya komputasi yang sangat besar dan belum terpenuhi.

Mengutip perhitungan Neocortex x CBN. Berdasarkan statistik Omdia, hingga akhir tahun 2023, total pengapalan Nvidia H100 mencapai 1,2 juta. Dalam empat kuartal hingga akhir April 2024, Nvidia memperoleh $65,8 miliar melalui penjualan chip AI. Berdasarkan harga setiap H100 sebesar US$40.000, NVIDIA telah menjual sekitar 1,645 juta H100 dalam empat kuartal terakhir. Kira-kira setara dengan pasar pelatihan model secara keseluruhan (yaitu, dengan asumsi bahwa 100 model bahasa besar tingkat GPT-3.5, 50 tingkat GPT-4, 10 model bahasa besar tingkat GPT-5, dan 10 model pembuatan gambar tingkat Midjourney telah dilatih secara global, dan 1/ 4 dari 20 model pembuatan video tingkat Sora).

Ini hanyalah permintaan pasar untuk pelatihan model. Inferensi adalah pasar yang jauh lebih besar dan belum benar-benar terbuka. Jika kita menghitung secara konservatif bahwa setiap orang hanya menghasilkan satu video per bulan, permintaan daya komputasi global untuk inferensi model besar setara dengan 10,4 juta chip H100, dua kali lipat dari pelatihan model. Dan jika teknologi dan pasar pembuatan video menjadi lebih matang, konsumsi daya komputasi yang diperlukan untuk inferensi akan melonjak hingga puluhan atau bahkan ratusan kali lipat dari kebutuhan pelatihan.

CEO Google Pichai berkata: "Risiko kekurangan investasi jauh lebih besar daripada risiko investasi berlebihan."

Seperti yang dikatakan CEO Meta Zuckerberg: "Saya lebih memilih berinvestasi berlebihan daripada menghemat uang dengan memperlambat pengembangan."

Microsoft mengklaim bahwa kapasitas daya komputasi AI saat ini membatasi pendapatan finansialnya, dan situasi ini akan berlanjut setidaknya hingga kuartal pertama tahun fiskal 2025. Musk bahkan mengembangkan superkomputernya sendiri untuk menantang Nvidia.

Terakhir, apakah parit Nvidia kuat? Ya.

Mengenai masa depan NVIDIA, Coatue mengutarakan pandangannya secara langsung:Kalau ada bubble, itu bukan bubble valuasi, tapi bubble dimana keuntungan ditarik ke depan.

Jadi, siapa yang bisa menantang Nvidia?

Di satu sisi, dibandingkan tiga tuduhan besar yang disebutkan di atas, Nvidia memiliki tuduhan yang lebih besar – bundling perangkat lunak dan perangkat keras.

Saat ini, lebih dari 95% prosesor di pusat data menggunakan GPU NVIDIA. Seluruh permintaan cloud AI masih bergantung pada ekosistem CUDA, dan CUDA hanya dapat digunakan dengan chip NVIDIA. Pemrogram tidak ingin mempelajari bahasa lain, dan CUDA bahkan dianggap sebagai parit NVIDIA.

Untuk menggulingkan "tirani" Nvidia, Google, Meta, dan Microsoft saat ini ingin bergabung untuk berpartisipasi dalam proyek bahasa sumber terbuka Triton yang diluncurkan oleh OpenAI, Intel, dan Qualcomm juga ingin menggunakan Triton untuk menjaring pelanggan Nvidia.

Meskipun Triton mungkin melemahkan pangsa pasar Nvidia, analis Citi memperkirakan bahwa pangsa pasar chip AI generatif Nvidia akan tetap setinggi sekitar 63% pada tahun 2030, yang berarti bahwa Triton akan mempertahankan dominasinya selama bertahun-tahun yang akan datang.

Di sisi lain, para raksasa telah mengeluarkan tantangan satu demi satu, dan Nvidia juga terus berjalan. Bagaimanapun, Huang Renxun pasti akan mengingat "masalah yang disebabkan oleh kesombongan" pendahulunya Cisco.

Menurut semikonduktor "siklus Makimoto" - jenis chip secara teratur bergantian antara tujuan umum dan khusus - struktur tujuan umum paling populer selama periode tertentu, tetapi setelah mencapai tahap tertentu, struktur khusus yang memenuhi kebutuhan spesifik akan meningkat secara langsung .

Saat ini, era struktur universal yang diwakili oleh NVIDIA sedang dalam proses subversi.

Terlebih lagi, pada awal tahun ini, Nvidia mendirikan unit bisnis baru untuk membangun chip khusus bagi pelanggan di bidang komputasi awan, telekomunikasi 5G, game, mobil, dan bidang lainnya. Ada kabar bahwa Nintendo Switch yang baru diluncurkan tahun ini kemungkinan akan dilengkapi dengan chip custom Nvidia.

Tapi apakah Nvidia benar-benar solid? Saya memikirkan sebuah kalimat: "Prosesnya benar, tetapi hasilnya salah." Untuk menggunakan analogi yang tidak tepat, jika daya tawar Nvidia yang kuat mendorong biaya daya komputasi AI tetap tinggi untuk waktu yang lama, sehingga menghambat skala besar. inovasi, mungkin juga ada Backlash.