notícias

NVIDIA lança sistema de superchip Blackwell GB200: desempenho de inferência de IA aumenta 1,5 vezes

2024-08-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Foi relatado anteriormente que o fornecimento da nova geração de GPUs da arquitetura NVIDIA Blackwell foi adiado. No entanto, o oficial não admitiu ou negou. Em vez disso, eles silenciosamente retiraram um sistema de servidor baseado na nova geração GB200 GPU + GPU super. chip e demonstrou isso.

GB200 Grace Blackwell inclui duas GPUs B200 e uma CPU Grace, com consumo total de energia de até 2700W.

Entre eles, o B200 possui 204 bilhões de transistores, memória HBM3E de 8.096 bits e 192 GB (largura de banda de 8 TB/s), o desempenho atinge 9PFlops (9 quatrilhões de vezes por segundo) e o consumo de energia atinge 1.000 W pela primeira vez.


O servidor exibido pela NVIDIA é como uma obra de arte, com cabos azuis e cor de cobre, um grande número de tubos de cobre de diâmetro ultragrosso e dissipadores de calor ultragrandes, formando um gigante.

A NVIDIA não divulgou a configuração específica, apenas que ela está dividida em duas versões com e sem NVSwitch, com largura de banda total de até 14,4 TB/s.

Em termos de desempenho, apenas um dado é fornecido: o desempenho de inferência de IA do modelo grande de 70 bilhões de parâmetros do Llama 3.1 foi melhorado 1,5 vezes em comparação com o H200.

O que fazer com a dissipação de calor? A NVIDIA revelou que está desenvolvendo um sistema de refrigeração com água quente que pode reduzir o consumo de energia em 28%.


No entanto, a NVIDIA ainda não deu um prazo de envio para os servidores GPU Blackwell, que está estimado para o quarto trimestre deste ano.

Na próxima conferência Hot Chip 2024, a NVIDIA explicará a GPU Blackwell em detalhes e divulgará mais notícias sobre as futuras CPU Vera e GPU Rubin.