berita

langka!Laporan: Peluncuran chip AI terbaru Nvidia tertunda karena cacat desain

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Chip AI tercanggih dalam seri chip Blackwell baru Nvidia mungkin mengalami penundaan dalam rilisnya.

Menurut The Information, mengutip orang-orang yang mengetahui masalah ini, chip kecerdasan buatan Nvidia yang akan datang akan melakukannyaPenundaan tiga bulan atau lebih karena cacat desain.

Hal ini dapat memengaruhi pelanggan seperti Meta Platforms, Google, dan Microsoft, yang secara kolektif telah memesan chip senilai puluhan miliar dolar.

Nvidia tidak mau mengomentari pengumuman penundaan tersebut, namun mengatakan pelanggan sedang menguji sampel chip Blackwell dan "produksi diperkirakan akan meningkat" akhir tahun ini.

Tidak lazim jika kelemahan desain besar ditemukan sebelum produksi massal

Informasi tersebut mengutip orang-orang yang terlibat dalam produksi chip Blackwell yang mengatakan bahwa masalah desain Blackwell telah muncul dalam beberapa minggu terakhir.Karena insinyur TSMC menemukan kekurangan tersebut saat mempersiapkan produksi massal.

Chip GB200 berisi dua GPU Blackwell yang terhubung dan unit pemrosesan pusat Grace. Cacat tersebut melibatkan chip prosesor (sepotong silikon yang digunakan untuk menampung sirkuit chip) yang terhubung ke dua GPU Blackwell. Rintangan ini mengurangi jumlah chip yang dapat diproduksi TSMC untuk Nvidia dan bahkan dapat menyebabkan perusahaan menghentikan produksinya.

Menurut laporan, Nvidia sedang melakukan uji coba produksi baru dengan produsen chipnya TSMC.Agar tidak membiarkan mesin membatasi,TSMC telah memulai kembali produksi produk terkenal lainnya yang mendekati produksi massal untuk mengatasi masalah tersebut.Situasi ini juga jarang terjadi.

Analis percaya bahwa sangat tidak biasa jika kelemahan desain besar ditemukan sebelum produksi massal. Karena beberapa uji produksi dan simulasi diperlukan pada tahap awal untuk memastikan kelayakan produk dan kelancaran proses produksi.

Menurut rencana awal, TSMC akan memulai produksi massal chip Blackwell pada kuartal ketiga dan mulai mengirimkannya ke Nvidia pada kuartal keempat. Huang mengatakan pada bulan Mei bahwa perusahaan berencana mengirimkan Blackwell dalam jumlah besar pada akhir tahun ini.

Masalah cacat desain ini mungkin menunda chip utama Blackwell (B200 dan GB200) selama 3 bulan atau lebih, dan produksi massal Blackwell akan ditunda hingga Q1 tahun depan. Setelah menerima chip tersebut, biasanya diperlukan waktu sekitar tiga bulan bagi penyedia cloud untuk mengoperasikan cluster skala besar mereka.

Harapan para raksasa telah kecewa dan masih belum jelas kapan barang tersebut akan diterima.

Blackwell dapat digambarkan sebagai "cahaya bulan putih" di benak perusahaan teknologi, yang membawa harapan besar para raksasa.

Jika chip AI yang akan datang seperti B100, B200, dan GB200 tertunda selama tiga bulan atau lebih, pelanggan Nvidia mungkin akan kecewa.

Pelanggan ini termasuk Microsoft, Meta dan OpenAI, dll. Mereka memiliki ekspektasi besar terhadap chip AI Nvidia dan berencana menggunakan "superkomputer" yang dikembangkan oleh Nvidia untuk menghasilkan model bahasa skala besar generasi mendatang, asisten Meta AI, dan fungsi otomatis lainnya.

Informasi tersebut mengutip orang-orang yang mengetahui masalah ini yang mengatakan bahwa Meta telah melakukan pemesanan senilai setidaknya $10 miliar, sementara Microsoft telah meningkatkan ukuran pesanannya sebesar 20% dalam beberapa minggu terakhir. Microsoft berencana menyiapkan 55.000-65.000 chip GB200 untuk OpenAI pada kuartal pertama tahun 2025.

Jelasnya, tanggal kapan Microsoft menerima pesanan ini masih belum diketahui.

Rak server NVLink mungkin terpengaruh

Cacat desain juga akan mempengaruhi produksi dan pengiriman rak server Nvidia NVLink, karena perusahaan yang mengerjakan server harus menunggu sampel chip baru sebelum menyelesaikan desain rak server.

Sebelumnya, analis Tianfeng International Ming-Chi Kuo menunjukkan bahwa keunggulan daya komputasi GB200 NVL36 tidak diragukan lagi, namun GB200 NVL36 juga menghadapi banyak tantangan desain dan produksi yang belum pernah terjadi sebelumnya .

Setiap kabinet GB200 NVL36 mengonsumsi daya sekitar 80kW. Menurut survei AMAX pada bulan April tahun ini, saat ini kurang dari 5% pusat data di dunia dapat mendukung server 50kW per kabinet. Oleh karena itu, sebelum membeli GB200 NVL36, Anda perlu memastikan tersedia cukup ruang untuk instalasi.
Versi kabinet tunggal GB200 NVL72 mengkonsumsi 130kW per kabinet dan tidak dapat diproduksi secara massal dalam jangka pendek.