notizia

NVIDIA presenta il sistema super chip Blackwell GB200: le prestazioni di inferenza dell'intelligenza artificiale aumentano di 1,5 volte

2024-08-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

In precedenza era stato riferito che la fornitura della nuova generazione di GPU con architettura NVIDIA Blackwell era stata ritardata, tuttavia il funzionario non lo ha ammesso né smentito, invece hanno ritirato tranquillamente un sistema server basato sulla super GPU+GPU della nuova generazione GB200 chip e lo ha dimostrato.

GB200 Grace Blackwell include due GPU B200 e una CPU Grace, con un consumo energetico totale fino a 2700 W.

Tra questi, B200 ha 204 miliardi di transistor, memoria HBM3E da 192 GB e 8096 bit (larghezza di banda 8 TB/s), le prestazioni raggiungono 9PFlops (9 quadrilioni di volte al secondo) e il consumo energetico raggiunge per la prima volta i 1000 W.


Il server mostrato da NVIDIA è come un'opera d'arte, con cavi blu e color rame, un gran numero di tubi di rame dal diametro ultra spesso e dissipatori di calore ultra grandi, che formano un colosso.

NVIDIA non ha rivelato la configurazione specifica, solo che è divisa in due versioni con e senza NVSwitch, con una larghezza di banda totale fino a 14,4TB/s.

In termini di prestazioni viene fornito un solo dato: le prestazioni di inferenza AI del modello Llama 3.1 da 70 miliardi di parametri di grandi dimensioni sono migliorate di ben 1,5 volte rispetto all'H200.

Cosa fare per la dissipazione del calore? NVIDIA ha rivelato che sta sviluppando un sistema di raffreddamento ad acqua calda in grado di ridurre il consumo energetico del 28%.


Tuttavia, NVIDIA non ha ancora fornito informazioni sui tempi di spedizione per i server GPU Blackwell, che si stima siano nel quarto trimestre di quest'anno.

Alla prossima conferenza Hot Chip 2024, NVIDIA spiegherà in dettaglio la GPU Blackwell e rivelerà ulteriori notizie sulle future CPU Vera e GPU Rubin.