notícias

O velho Huang faz outro movimento surpreendente!É lançado o primeiro servidor GB20 de “edição especial”, que pode ser lançado no próximo ano

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Novo Relatório de Sabedoria

Editor: Departamento Editorial

[Introdução à Nova Sabedoria]A mídia estrangeira deu a notícia de que a Nvidia lançará um chip de IA personalizado para o mercado chinês no próximo ano e até desenvolverá um servidor compatível. Esta é a primeira vez na história da Nvidia.

A batalha entre a Nvidia e o Departamento de Comércio dos EUA aumentou novamente!

Sob os controlos de exportação dos EUA, Lao Huang continua a apresentar estratégias alternativas e está a decorrer um jogo do gato e do rato.


Após a implementação de novos regulamentos de controle de exportação, Lao Huang não conseguiu ganhar dinheiro no mercado chinês.

A partir de janeiro deste ano, as novas regulamentações de exportação foram implementadas há exatamente um ano, e a proporção do mercado chinês na receita da Nvidia caiu para 17%. Há dois anos, esse número ainda era de 25%+.

Diante da regulamentação, a Nvidia tem lançado continuamente chips de “edição especial” personalizados para a China. No entanto, esses chips com desempenho enfraquecido muitas vezes não vendem bem.

As vendas do H20, que tiveram um péssimo começo antes, começaram a subir, mas a Nvidia ficou chocada ao ouvir as más notícias——

Os analistas da Jefferies revelaram em um relatório de pesquisa na semana passada que o Departamento de Comércio dos EUA conduzirá sua revisão anual das restrições à exportação de semicondutores em outubro e poderá proibir a exportação de chips H20.

A supervisão continua a aumentar e, desta vez, Lao Huang deu o seu melhor.

Ela não apenas lançou o novo chip AI B20, mas temeu que não fosse fácil de usar, mas também lançou o servidor de suporte GB20.


Não é difícil adivinhar pelo nome que B20 é uma variante do Blackwell B200 lançado pela Nvidia em março deste ano.

Sendo a GPU mais rápida até hoje, o B200 pode processar determinadas tarefas até 30 vezes mais rápido que seu antecessor. (por exemplo, deixe o chatbot gerar respostas)

Infelizmente, isso não tem nada a ver com o chip B20 de "edição especial"...

O B20, que nasceu sob as restrições da política de controlo de exportações dos EUA, está destinado a ser um produto básico, em nítido contraste com o B200 com desempenho de IA líder da indústria.

No entanto, de acordo com a fonte, embora o B20 seja mais lento que o B200 no processamento de cálculos de IA, a instalação de um grande número de chips juntos no servidor GB20 pode compensar parcialmente esta deficiência.

Isto garantirá que a Nvidia mantenha um certo grau de competitividade ao competir com produtos chineses, ao mesmo tempo que cumpre o limite superior de capacidade de computação do chip exigido pelos controlos de exportação dos EUA.

Sob controle, um “jogo de gato e rato” é jogado

Desde o final de 2022, a Nvidia reconfigurou repetidamente seus chips para o mercado chinês, visando as necessidades dos clientes chineses que precisam de chips para desenvolver LLM, tentando permanecer atraente para os clientes chineses e ao mesmo tempo cumprir as regulamentações dos EUA.

Em outubro de 2022, o governo dos EUA proibiu a venda dos A100 e H100 da Nvidia, seus chips de inteligência artificial mais avançados na época.

Poucos meses depois, a Nvidia lançou dois produtos alternativos, A800 e H800, para o mercado chinês.

Menos de um ano depois, o Departamento de Comércio dos EUA atualizou mais uma vez as suas medidas de controlo de exportação e impôs restrições a estes dois chips.

A Nvidia respondeu rapidamente,


Entre eles, o chip H20 tem desempenho limitado, mas maior velocidade de conexão. Com memória de alta largura de banda e suporte de software maduro, traz melhor desempenho.

Embora as vendas iniciais tenham sido fracas, cada vez mais clientes chineses estão optando por comprar este chip.

De acordo com quatro pessoas diretamente envolvidas nas vendas de chips Nvidia na China, as empresas chinesas encomendaram mais de 500.000 chips H20 com um valor total de quase 5,8 mil milhões de dólares e serão entregues em 2024.

A empresa de pesquisa SemiAnalysis também fez estimativas otimistas de que a Nvidia venderá mais de 1 milhão de chips H20 na China este ano, no valor de mais de US$ 12 bilhões.

Mas, como mencionado anteriormente, este negócio enfrenta novas ameaças do Departamento de Comércio. Quando as regulamentações forem ajustadas no final do ano, a venda do H20 poderá ser proibida.

Essa proibição pode assumir muitas formas, incluindo proibições específicas de produtos, reduzindo o poder computacional de um chip ou limitando a sua capacidade de memória.

Afinal de contas, o contexto macroeconómico é tal que, em geral, se espera que os Estados Unidos continuem a exercer pressão sobre os controlos de exportação relacionados com semicondutores.

Os Estados Unidos querem que a Holanda e o Japão restrinjam ainda mais o fornecimento de equipamentos de fabricação de chips para a China, disseram fontes.


Sob o controle crescente, podem aparecer cada vez mais “edições especiais”.


Há rumores de que a Nvidia também está desenvolvendo uma nova placa gráfica para jogos, a RTX 5090D.


A placa gráfica será projetada especificamente para o mercado chinês e é uma continuação da RTX 4090D, a primeira placa gráfica voltada para o consumidor que atende aos padrões de exportação.

O desempenho do chip não é suficiente, é necessário um servidor para compensar

As especificações específicas do B20 ainda não foram determinadas, mas o certo é que ele definitivamente não quebrará o “teto” da política de exportação de GPUs dos EUA.

Assim como seus antigos antecessores - os lançados anteriormente H20, L20 e L2, o desempenho desses três chips pode ser considerado "épico". Não apenas o desempenho é ruim, mas também está equipado com apenas uma versão residual do NVLink. conectar.

TPP e PD são dois indicadores principais para travar a garganta

Os Estados Unidos têm regulamentações rígidas de desempenho sobre as exportações de GPU da China e usam um indicador chamado “Poder Total de Processamento” (TPP).

Esta métrica leva em consideração o TFLOPS e a precisão do poder de computação da GPU. Especificamente, multiplicar TFLOPS (sem dispersão) pela precisão (em bits) fornece TPP.

O limite atual está definido em 4.800 TPP, o que isso significa?

Tomando como referência os produtos anteriores da NVIDIA: Hopper H100 e H200 excederam em muito esse padrão. O TPP de ambas as GPUs atingiu 16.000, o que é mais de três vezes o limite superior especificado.


Até o RTX 4090 excede o limite com seu poder de computação FP8 de 660,6 TFLOPS.

A GPU de desktop Nvidia mais poderosa que permanece dentro do limite de 4800 TPP é a RTX 4090D, que foi construída especificamente para cumprir as restrições de exportação.


A Blackwell estabeleceu uma nova referência em desempenho computacional, com sua solução de chip duplo provavelmente produzindo cerca de 4.500 TFLOPS de poder computacional do 8º FP, o que seria 7,5 vezes o limite de exportação.

Em outras palavras, o desempenho do B20 será inferior a 1/7 do desempenho do Blackwell B200!

Além disso, o B20 também enfrenta restrições adicionais – restrições de “Densidade de Desempenho” (PD).

Esta é uma restrição imposta especificamente às GPUs de data centers nos Estados Unidos, e as GPUs de consumo não são afetadas por isso.

O indicador PD pode ser obtido dividindo a pontuação TPP pelo tamanho do chip. O PD das GPUs exportadas para a China não deve ser superior a 6,0.

De acordo com este indicador, as GPUs da série RTX 40 (arquitetura Ada Lovelace) não poderão mais ser utilizadas em data centers.

Blackwell é obviamente melhor que Ada Lovelace em termos de densidade e desempenho.

Em outras palavras, a Nvidia precisa limitar estritamente o desempenho do B20 ou usar uma proporção maior de chips para cumprir os regulamentos relevantes.

De acordo com Tom's Hardware, o B20 será o sucessor das GPUs AI básicas A30 e H20 da Nvidia.

Tomando o H20 como exemplo, seu poder de computação FP16 é de apenas 296 TFLOPS, TPP é 2368, PD é apenas 2,90, enquanto H100/H200 é 1979 TFLOPS.


Ao mesmo tempo, o A30 tem uma pontuação TPP de 2.640 e uma pontuação PD de 3,20, que é um pouco superior ao H20.

Percebe-se que a GPU AI construída pela Nvidia para o mercado chinês tem algum espaço para melhorias de desempenho, mas o espaço é muito limitado.

Na melhor das hipóteses, a Nvidia pode tentar criar uma GPU com um TPP entre 4.000 e 4.500 e um tamanho de matriz de 800 milímetros quadrados.

GB20: Faça o nosso melhor para salvar o desempenho do B20

Para tornar o próximo B20 mais eficiente, a Nvidia está empregando estratégias usadas com o H20, como a atualização da capacidade de memória, uma vez que os chips de memória não estão sujeitos aos atuais controles de exportação.

Segundo duas pessoas envolvidas no desenvolvimento do servidor, a Nvidia está trabalhando para aumentar a velocidade de transferência de dados entre a memória e os processadores B20, para que grandes conjuntos de dados de energia possam ser processados ​​mais rapidamente.

Além disso, a Nvidia também usará sua tecnologia NVLINK (que permite comunicação rápida entre diferentes chips) e soluções de refrigeração no design do rack GB20.

Espera-se que isso aumente a utilização de chips B20 e a eficácia dos clusters de computação GB20 no fornecimento de inteligência artificial, acrescentou a dupla.

O sistema GB20 permitirá que os clientes realizem treinamento e inferência de IA, executando vários chips em paralelo com mais eficiência.

Antes de o GB20 ser exposto, Tom's Hardware previu corajosamente que o B20 seria um chip difícil de vender.

Mas agora, com a bênção do GB20, parece haver uma nova esperança.

Referências:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- regulamentos

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules