nouvelles

NVIDIA lance le système de super puce Blackwell GB200 : les performances d'inférence de l'IA sont multipliées par 1,5

2024-08-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Il a été signalé précédemment que la fourniture de la nouvelle génération de GPU à architecture NVIDIA Blackwell avait été retardée. Cependant, le responsable ne l'a ni admis ni nié. Au lieu de cela, ils ont discrètement retiré un système de serveur basé sur la nouvelle génération de GPU + GPU Super. puce et l'a démontré.

Le GB200 Grace Blackwell comprend deux GPU B200 et un processeur Grace, avec une consommation électrique totale allant jusqu'à 2 700 W.

Parmi eux, le B200 possède 204 milliards de transistors, une mémoire HBM3E de 8 096 bits de 192 Go (bande passante de 8 To/s), les performances atteignent 9PFlops (9 quadrillions de fois par seconde) et la consommation d'énergie atteint 1 000 W pour la première fois.


Le serveur affiché par NVIDIA est comme une œuvre d'art, avec des câbles bleus et cuivrés, un grand nombre de tubes en cuivre de diamètre ultra épais et des dissipateurs thermiques ultra grands, formant un monstre.

NVIDIA n'a pas divulgué la configuration spécifique, seulement qu'elle est divisée en deux versions avec et sans NVSwitch, avec une bande passante totale allant jusqu'à 14,4 To/s.

En termes de performances, une seule donnée est fournie : les performances d'inférence IA du grand modèle Llama 3.1 à 70 milliards de paramètres sont améliorées de 1,5 fois par rapport au H200.

Que faire en cas de dissipation de chaleur ? NVIDIA a révélé qu'elle développait un système de refroidissement à eau chaude capable de réduire la consommation d'énergie de 28 %.


Cependant, NVIDIA n'a toujours pas donné de délai de livraison pour les serveurs GPU Blackwell, qui est estimé au quatrième trimestre de cette année.

Lors de la prochaine conférence Hot Chip 2024, NVIDIA expliquera en détail le GPU Blackwell et divulguera davantage d'informations sur les futurs CPU Vera et GPU Rubin.