notícias

3 trilhões de empresas de chips também estão tentando sobreviver?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A Nvidia planeja produzir novamente chips especiais de IA para o mercado chinês.

De acordo com o último relatório da Reuters, pessoas familiarizadas com o assunto disseram que a Intel está desenvolvendo um novo chip de IA carro-chefe para o mercado chinês que atende aos requisitos dos atuais controles de exportação dos EUA e adiciona outro membro à linha doméstica de chips especiais da Nvidia.

Vale ressaltar que a Nvidia lançou a série “Blackwell” em março deste ano, que deverá ser produzida em massa ainda este ano. Segundo a Nvidia, o B200 é 30 vezes mais rápido que seu antecessor em determinadas tarefas. dos principais chips de IA disponíveis atualmente.

Este novo chip principal especial também está relacionado ao B200. Fontes disseram que a Nvidia irá cooperar com o Inspur Group, um de seus principais parceiros de distribuição na China, para lançar e distribuir este chip, provisoriamente denominado "B20". pode ter alguns recursos do B200.

Contando este B20, em pouco mais de um ano a Nvidia lançou sete ou oito chips especiais para o mercado chinês.

A800 e H800

Em 7 de outubro de 2022, o governo dos EUA anunciou uma série de medidas de controle de exportação, incluindo o corte do fornecimento de certos chips semicondutores e equipamentos de fabricação de chips para a China.

Além de afetar equipamentos de produção, como máquinas de fotolitografia, também restringe o acesso da China a chips de alta computação e inteligência artificial em processos avançados, incluindo a proibição de empresas americanas como Nvidia e AMD de venderem esses chips para a China, e também restringindo a inteligência artificial da China. As empresas de chips realizam fitas adesivas em fábricas Fab no exterior com tecnologia americana.

Sob esta restrição de exportação, tanto a Nvidia quanto a AMD foram afetadas.

Depois que as restrições foram introduzidas, a Nvidia disse que a proibição afetou seus chips A100 e H100 projetados para acelerar tarefas de aprendizado de máquina e pode impedir a conclusão do desenvolvimento de seu chip carro-chefe H100, a ser lançado em 2022. Ele ressaltou que as vendas dos chips afetados na China durante o trimestre atingiram 400 milhões de dólares americanos. Se as empresas chinesas decidirem não comprar os produtos substitutos da Nvidia, esse dinheiro será perdido em vão.

Então, como as restrições à exportação dos EUA restringem especificamente os chips Nvidia?

De acordo com as regras de restrição à exportação de circuitos integrados de computação avançada (ECCN 3A090 e 4A090) emitidas pelo Departamento de Comércio dos EUA em 7 de outubro de 2022, a lista de itens controlados precisa atender às seguintes condições:

a. Circuitos integrados, exceto memória volátil, com taxa de transferência bidirecional total de todas as entradas e saídas ou programável para 600 GB/s ou mais, e qualquer um dos seguintes circuitos integrados:

a.1. Uma ou mais unidades de processador digital que executam instruções de máquina, o comprimento de bits de cada operação multiplicado pelo desempenho de processamento em TOPS, e a soma de todas as unidades de processador é 4800 ou mais;

a.2. Uma ou mais "unidades de computação bruta" digitais (excluindo unidades que auxiliam na execução de instruções de máquina relacionadas com o cálculo dos TOPS de 3A090.a.1) cujo comprimento de bits por operação é multiplicado pela soma de todas as unidades de computação. O desempenho de processamento TOPS é 4800 ou superior;

a.3. Uma ou mais "unidades de computação originais" de simulação, de valores múltiplos ou de vários níveis, cujo desempenho de processamento é calculado como TOPS multiplicado por 8, e o total de todas as unidades de computação atinge ou excede 4.800;

a.4. Qualquer combinação de unidades de processamento digital e "unidades de computação originais" cuja soma calculada de acordo com 3A090.a.1, 3A090.a.2 e 3A090.a.3 seja igual ou superior a 4800.

O circuito integrado descrito em 3A090.a inclui unidade de processamento gráfico (GPU), unidade de processamento de tensor (TPU), processador neural, processador de memória, processador de visão, processador de texto, coprocessador/acelerador, dispositivos de processamento adaptativo, dispositivos lógicos programáveis ​​em campo. (FPLD) e circuitos integrados específicos de aplicação (ASIC).

Não é difícil ver que o mais importante é o limite de velocidade de interconexão de chips. De acordo com este regulamento, o A100 de grande sucesso da NVIDIA caiu dentro do limite e sua taxa de transferência entre chips atingiu 600 GB/s. Até certo ponto, talvez o Departamento de Comércio dos EUA tenha designado esta restrição com base na A100.

Para lidar com os controles de exportação, a NVIDIA rapidamente castrou um substituto para o A100-A800. A proibição dos EUA foi anunciada oficialmente em 7 de outubro de 2022 e, um mês depois, a NVIDIA apresentou o A800 que se adapta às novas regulamentações. ser adaptado às condições locais no passado, mas agora está adaptado às condições políticas.

De acordo com as especificações, o NVIDIA A800 usará a mesma arquitetura de chip da GPU Ampere A100. Estará disponível em três versões, duas versões PCIe de 40 GB e 80 GB e uma versão SXM de 80 GB. Essas GPUs fornecerão até 9,7 TFLOP de FP64, 19,5 TFLOP de FP64 Tensor Core, 19,5 TFLOP de FP32, 156 TFLOP. (escassidade de 312 TFLOPs) TF32, 312 TFLOPs (escassidade de 624 TFLOPs) BFLOAT16 e 624 TOPS (escassidade de 1248 TOPs) Desempenho INT8. A versão de 40 GB possui memória HBM2 com largura de banda de até 1.555 TB/s, enquanto a versão de 80 GB possui memória HBM2e com largura de banda de até 2 TB/s.

É claro que, para atender à demanda limitada, a largura de banda inevitavelmente sofreu um corte, dos 600 GB/s originais para 400 GB/s. Um porta-voz da Nvidia disse em comunicado à Reuters: “A GPU A800 foi colocada em operação no. No terceiro trimestre de produção, uma alternativa à GPU A100 para clientes chineses, o A800 atende aos testes explícitos do governo dos EUA para redução de controle de exportação e não pode ser programado além desse padrão.”

O analista da CCS Insight, Wayne Lam, comentou: “O A800 parece ser uma GPU A100 reembalada, projetada para evitar as recentes restrições comerciais do Departamento de Comércio”, enquanto apontava que 8 é um número da sorte na China.

“A China é um mercado importante para a Nvidia e faz sentido do ponto de vista comercial reconfigurar o produto para evitar restrições comerciais”, disse Lam, que disse que as capacidades de comunicação entre chips do A800 foram significativamente reduzidas para data centers que usam milhares de chips.

No H100 subsequente, a Nvidia seguiu o exemplo e criou o H800. No A100, a Nvidia reduziu a interconexão de 600 GB/s da GPU para 400 GB/s, e fez a mesma coisa com o H100. Segundo relatos, a taxa de interconexão do chip do H800 foi reduzida para cerca de metade da do H100, ou seja, de 800 GB/s para 400 GB/s. Comparado com o A800, o desempenho do H800 tem um impacto maior. Afinal, o primeiro é reduzido apenas em 33% e o último é reduzido em 50%.

Na época, um porta-voz da Nvidia recusou-se a divulgar a diferença entre o H800 e o H100 para o mercado chinês, dizendo apenas que “nossos produtos da série 800 cumprem integralmente os regulamentos de controle de exportação”.

Quando os fabricantes estrangeiros estão comprando A100 e H100 freneticamente, os fabricantes nacionais só podem escolher H800 e A800 com configurações mais baixas. A versão especial do chip da NVIDIA restringiu até certo ponto o desenvolvimento de grandes modelos domésticos de IA.

H20 e RTX 4090D

Para as empresas nacionais, o A800 e o H800 têm qualidades boas e ruins. O ruim é que depois de cortar a largura de banda da Internet, o desempenho desses dois chips fica um pouco pior e a velocidade de treinamento também fica muito mais lenta. eles são bons e ruins. Podem ser encomendados através dos canais Zhengcheng, mas em comparação com empresas estrangeiras, o custo dos chips será mais alto.

Mas o A800 e o H800 também não duraram mais de um ano. Em 17 de outubro de 2023, o Departamento de Comércio dos EUA emitiu novas regras de controle para regular a exportação de circuitos integrados de computação avançada, equipamentos de fabricação de semicondutores e itens que suportam aplicações e usos finais de supercomputação, emitidas em 7 de outubro de 2022. Atualizações adicionais.

A principal delas são as mudanças nos parâmetros de controle. A regra final provisória remove a "largura de banda de interconexão" como parâmetro para identificar chips restritos no ECCN 3A090 e, em vez disso, altera-o para se o chip exceder os dois parâmetros calibrados no ECCN 3A090 (3A090. ae). 3A090.b), a exportação será restrita.

De acordo com os documentos do Departamento de Comércio dos EUA, os parâmetros regulatórios 3A090.a revisados ​​regularão os circuitos integrados com uma ou mais unidades de processamento digital, e o "desempenho total de processamento" dessas unidades deve ser 4800 ou superior, ou "processamento total desempenho" é 1600 ou superior e "Densidade de desempenho" é 5,92 ou superior. O novo ECCN 3A090.b regulamentará circuitos integrados com uma ou mais unidades de processamento digital que devem ter uma das seguintes condições: um “desempenho total de processamento” de 2.400 ou mais, mas inferior a 4.800 e uma “densidade de desempenho” de 1,6 ou 1,6. ou mais, mas inferior a 5,92, ou o "desempenho total de processamento" é 1600 ou mais, e a "densidade de desempenho" é 3,2 ou superior a 3,2, mas inferior a 5,92.

Além disso, a regra cria uma exceção de licenciamento que cria um novo “Aviso de exceção de licenciamento para computação avançada” para ICs de consumo com recursos de inteligência artificial abaixo do limite restritivo. A exceção se aplica a dois produtos, um projetado ou chips vendidos para uso em dados. centros, sendo o segundo chips não projetados ou vendidos para uso em centros de dados, têm um “desempenho total de processamento” de 4.800 ou superior.

Em comparação com as regras de 7 de outubro de 2022, as novas regras ampliaram mais uma vez o escopo do controle. Sob as regras duplas de desempenho total de processamento e densidade de desempenho, tanto os produtos não castrados quanto os castrados são incluídos nos controles de exportação. escopo, A800 e H800 foram afetados, enquanto outros produtos da Nvidia também foram afetados. O L40 e L40S para o mercado de raciocínio, e o RTX 4090 no campo do consumidor também foram incluídos na proibição.

Este foi um duro golpe para a Nvidia, o que significou que os principais produtos vendidos pela Nvidia na época não podiam ser vendidos na China devido aos controles de exportação. Você deve saber que nos anos anteriores, a receita dos negócios de data center do mercado chinês era responsável. aproximadamente a receita geral da Nvidia de 20% a 25%, e no quarto trimestre do ano fiscal de 2024, devido aos controles de exportação, a receita no mercado chinês despencou para um dígito.

Desamparada, a Nvidia só conseguiu empunhar o facão novamente.

Em 16 de novembro de 2023, um mês após o lançamento das novas regras, a NVIDIA lançou chips GPU especialmente para o mercado chinês - H20, L20 e L2 são baseados na arquitetura Hopper da NVIDIA, enquanto L20 e L2 são baseados na Ada. arquitetura.

Entre eles, os dois chips L20 e L2 foram ajustados com base em L40 e L4 respectivamente. Por serem arquiteturas antigas e não serem comumente usadas em raciocínio e treinamento, não receberam muita atenção. O H20 é mais interessante Embora as novas regulamentações não limitem mais a velocidade da Internet, ele obteve NVLink puro de 900 GB/s, mas o desempenho tem que ser bastante descontado Segundo a opinião do analista Dylan Petal, mesmo que seja o real. utilização do H20 A eficiência pode chegar a 90%, mas seu desempenho no ambiente real de interconexão multiplacas ainda está próximo de 50% do H100.

Para o RTX 4090 no mercado consumidor, a NVIDIA também lançou um substituto - RTX 4090D em dezembro do ano passado. Este chip especial que atende aos controles de exportação dos EUA foi castrado em termos de núcleo CUDA e o consumo de energia foi reduzido. 12,8%, o consumo de energia também foi reduzido de 450W para 425W, uma redução de 5,9%, todas as outras especificações básicas permanecem as mesmas.

Devido ao ligeiro aumento na frequência principal, em alguns testes de benchmark, o desempenho do 4090D é apenas cerca de 5% inferior ao do 4090. Comparado com chips AI, esta lacuna parece estar dentro da faixa aceitável.

Os quatro chips especiais consecutivos no final de 2023 aliviaram até certo ponto o constrangimento da Nvidia China e evitaram que ela ficasse sem produtos para vender. No entanto, após duas rodadas de restrições, grandes e pequenas e médias empresas ficaram. começou a procurar outro lugar. A saída é comprar chips nacionais, construir servidores no exterior ou comprar H100/200 e A100 por meio de canais não oficiais, que não têm escolha a não ser se espalhar entre os fabricantes nacionais.

As habilidades com a faca de Lao Huang

Os jogadores DIY que estão familiarizados com GPUs para jogos não desconhecem as habilidades com a faca de Lao Huang.

Vejamos um exemplo relativamente recente. Um ano após o lançamento da série RTX 20, para melhor diferenciar a linha de produtos e responder ao lançamento de novos produtos da série RX5000 da AMD, a Nvidia lançou a série RTX 20 Super.

Embora também sejam baseados nos núcleos TU106 e TU104, a NVIDIA usou esses dois núcleos para criar cinco placas gráficas, nomeadamente RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super e RTX 2080. Entre eles, a menor lacuna está entre A diferença teórica de desempenho entre o núcleo TU106 RTX 2060 Super e RTX 2070 é de apenas cerca de 5%, e as pontuações reais de execução e testes de jogos também são muito próximas. Pode-se dizer que a Nvidia levou a castração ao extremo.

Hoje em dia, os chips especialmente modificados produzidos pela Nvidia para a China nada mais são do que uma repetição do passado e um regresso aos velhos negócios.

Além do B20 que mencionamos no início, a Nvidia também planeja mostrar suas habilidades no mercado consumidor. Segundo relatos, o RTX 5090D, uma versão reduzida do RTX 5090, está previsto para ser lançado em janeiro de 2025 e. espera-se que seja baseado na arquitetura Blackwell da Nvidia. O uso do processo 4NP da TSMC pode reduzir as especificações básicas para contornar as restrições de exportação dos EUA.

Contando esses dois rumores de chips, a NVIDIA já tem uma enorme linha especial na China: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Algumas pessoas estão bastante otimistas sobre as perspectivas desses chips de edição especial. A organização de pesquisa SemiAnalysis estima que a Nvidia deverá vender mais de 1 milhão de chips H20 na China este ano, no valor de mais de 12 bilhões de dólares americanos.

Mas a Nvidia ainda tem muito com que se preocupar. De acordo com um relatório dos analistas da Jeffries, quando os Estados Unidos conduzirem sua revisão anual dos controles de exportação de semicondutores em outubro, é "muito provável" proibir as vendas de chips H20 da Nvidia para a China. O analista disse que a proibição pode ser por meio de "produtos específicos". proibições, limites de capacidade de computação mais baixos e/ou capacidade de memória limitada" para implementar.

Além disso, cartões de conformidade fabricados artificialmente como o H20 são essencialmente baseados na castração de núcleos existentes. O mesmo se aplica ao B20. Poderia ter sido usado como núcleo do H200 e B200, mas agora só pode ser usado para vender especiais mais baratos. edições., e a vida útil das vendas provavelmente será de apenas mais de um ano, portanto, é um negócio deficitário, não importa como você o veja.

Mas a Nvidia não tem saída. Ela só pode tentar o seu melhor para equilibrar as regras e o mercado. Mas quantas empresas na China estão dispostas a pagar pelos chips de edição especial que são cortados continuamente?