berita

NVIDIA meluncurkan sistem chip super Blackwell GB200: kinerja inferensi AI melonjak 1,5 kali lipat

2024-08-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Sebelumnya diberitakan bahwa pasokan GPU arsitektur NVIDIA Blackwell generasi baru telah tertunda. Namun, pejabat tersebut tidak mengakui atau menyangkalnya, malah mereka diam-diam mengeluarkan sistem server berbasis GPU+GPU super generasi baru chip dan mendemonstrasikannya.

GB200 Grace Blackwell mencakup dua GPU B200 dan satu CPU Grace, dengan total konsumsi daya hingga 2700W.

Diantaranya, B200 memiliki 204 miliar transistor, memori HBM3E 8096-bit 192GB (bandwidth 8TB/s), performa mencapai 9PFlops (9 kuadriliun kali per detik), dan konsumsi daya mencapai 1000W untuk pertama kalinya.


Server yang ditampilkan oleh NVIDIA seperti sebuah karya seni, dengan kabel berwarna biru dan tembaga, sejumlah besar tabung tembaga berdiameter sangat tebal, dan heat sink yang sangat besar, membentuk sebuah raksasa.

NVIDIA tidak membeberkan konfigurasi spesifiknya, hanya saja terbagi menjadi dua versi dengan dan tanpa NVSwitch, dengan total bandwidth hingga 14,4TB/s.

Dalam hal kinerja, hanya satu data yang diberikan: kinerja inferensi AI model besar Llama 3.1 dengan 70 miliar parameter ditingkatkan sebanyak 1,5 kali lipat dibandingkan dengan H200.

Apa yang harus dilakukan terhadap pembuangan panas? NVIDIA mengungkapkan sedang mengembangkan sistem pendingin air panas yang dapat mengurangi konsumsi daya hingga 28%.


Namun NVIDIA masih belum memberikan waktu pengiriman untuk server GPU Blackwell yang diperkirakan pada kuartal keempat tahun ini.

Pada konferensi Hot Chip 2024 mendatang, NVIDIA akan menjelaskan GPU Blackwell secara detail dan mengungkap lebih lanjut berita tentang CPU Vera dan GPU Rubin di masa depan.