notícias

a "fonte de declínio" da nvidia: chips de última geração, quanto mais poderoso o desempenho, mais difícil é fabricar

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor | gao zhimo

editor | ia difícil

se a “fonte de declínio” da nvidia pudesse ser resumida em uma frase, seriam chips de última geração. quanto mais forte o desempenho, mais difícil é fabricá-los.

na quarta-feira, ao relatar fortes vendas e lucros trimestrais, a nvidia também observou que as dificuldades de fabricação de novos chips levaram a margens de lucro mais baixas e que a empresa reservou us$ 908 milhões em reservas no último trimestre. afetado por isso, o preço de suas ações caiu 6,4% na quinta-feira.

a empresa admitiu em comunicado que as gpus da arquitetura blackwell têm problemas de rendimento e precisam redesenhar parte do design do processador b200 para melhorar o rendimento. portanto, a produção em massa da próxima geração de gpu da arquitetura blackwell será adiada para o quarto trimestre de 2024:

“ajustamos o design das gpus blackwell para melhorar o rendimento da produção. o plano de produção da blackwell começará no quarto trimestre e continuará até o ano fiscal de 2026.

esperamos que os produtos blackwell gerem bilhões de dólares em receitas no quarto trimestre. "

a nvidia não detalhou a causa específica do problema. mas analistas e executivos da indústria acreditam que os desafios de engenharia decorrem principalmente de questões complexas de processos de fabricação impostas pelo design do chip blackwell.

a análise apontou que o enorme tamanho e o design complexo da blackwell trouxeram uma complexidade de fabricação sem precedentes. defeitos em qualquer componente podem fazer com que o chip seja descartado, afetando assim o rendimento e os lucros. além disso, diferenças nos coeficientes de expansão térmica de várias partes do chip também podem causar empenamento da embalagem, afetando o desempenho e a confiabilidade.

para melhorar a taxa de rendimento, a nvidia ajustou o design da blackwell e planeja aumentar a produção conforme planejado. no entanto, os analistas acreditam que a complexidade da adoção da nova tecnologia de conexão de chips da tsmc e os desafios inerentes trazidos pelo tamanho dos chips ainda serão os principais obstáculos à produção em massa da blackwell.

g. dan hutcheson, vice-presidente da empresa de análise industrial techinsights, disse:

“o problema é como fazer os chips funcionarem juntos e melhorar o rendimento. quando o rendimento de cada parte do chip não é alto o suficiente, tudo pode estragar rapidamente.”

01

a complexidade dos chips blackwell

para manter sua posição de liderança no campo de chips de inteligência artificial, a nvidia (nvda) aposta no conceito de “quanto maior, melhor”. no entanto, embora o tamanho maior traga um desempenho mais forte, também traz maior dificuldade de fabricação.

o mais recente chip ai da nvidia, blackwell, é descrito por huang jen-hsun como uma “gpu muito, muito grande”. no sentido físico, é de fato a maior gpu atualmente. é composto por duas matrizes blackwell e usa o processo de 4 nm da tsmc. possui 2.080 bilhões de transistores - 2,6 vezes a geração anterior.

analistas do ubs disseram em um relatório no início deste mês que o principal problema que a nvidia encontrou com a blackwell foi a complexidade de adotar o novo método de empacotamento cowos-l da tsmc.

semianálise, uma mídia profissional da indústria de semicondutores, relatou que esta tecnologia de empacotamento usa um interpositor rdl com pontes de interconexão de silício local (lsi) para conectar as partículas do núcleo, e a taxa de transmissão pode atingir cerca de 10 tb/s. pontes exigem extremamente alto. um defeito em qualquer componente pode fazer com que todo o chip no valor de us$ 40.000 seja descartado, afetando assim o rendimento e os lucros.

além disso, o empenamento do chip e a falha do sistema ocorrem devido à incompatibilidade do coeficiente de expansão térmica (cte) entre o chip da gpu, as pontes lsi, o interpositor rdl e o substrato da placa-mãe. segundo relatos, para melhorar o rendimento, a nvidia teve que redesenhar a camada metálica superior e as saliências do chip gpu.

huang jenxun enfatizou em teleconferência com analistas que o chip blackwell não requer nenhuma “mudança funcional” e que todos os ajustes são para melhorar o rendimento.

a diretora financeira colette kress disse que a nvidia está aumentando a produção da blackwell conforme planejado e espera que a blackwell traga bilhões de dólares em receitas para a empresa no quarto trimestre.

02

micron adiciona novo plano de expansão de produção de dram

de acordo com relatos da mídia japonesa, a micron planeja construir uma nova fábrica de produção de chips dram na província de hiroshima, no japão, com o objetivo de colocá-la em operação já no final de 2027.

esse tipo de problema não é exclusivo da nvidia. especialistas da indústria dizem que esses problemas aumentarão à medida que os fabricantes de chips procuram aumentar o poder de processamento aumentando o tamanho do chip. mudanças no projeto do chip para eliminar defeitos ou melhorar o rendimento também são comuns na indústria.

su zifeng, ceo da gigante de chips amd, também destacou que à medida que o tamanho do chip continua a aumentar, a complexidade de fabricação aumentará inevitavelmente.os chips da próxima geração precisam alcançar avanços em eficiência energética e consumo de energia para atender à enorme demanda por poder computacional em data centers de inteligência artificial.

“é preciso muito investimento técnico para fazer essas tecnologias funcionarem”, disse ela. "eles vão ficar mais complexos e maiores? não há dúvida disso. essa é a nossa realidade."

é claro que, para ultrapassar o limite de tamanho de um único chip, a estratégia radical da nvidia de combinar dois chips maiores para criar a blackwell também atraiu dúvidas dos concorrentes.

andrew feldman, fundador da rival cerebras systems, acredita que a dificuldade de desenvolver tecnologia de combinação de múltiplos chips aumentará exponencialmente. a cerebras systems optou por desenvolver um único chip gigante e lançou um serviço de computação em nuvem de inteligência artificial baseado nele, na tentativa de desafiar a posição de mercado da nvidia.

andrew feldman disse:

“fazer um trabalho significativo em inteligência artificial requer muito poder de computação, o que requer muitos transistores, mais do que um único chip pode conter...

já é difícil desenvolver tecnologia de dois chips, é ainda mais difícil desenvolver tecnologia de quatro chips e é ainda mais difícil desenvolver tecnologia de oito chips. "

se a estratégia de chips gigantes da nvidia pode finalmente vencer, ainda será testado pelo mercado. mas o que é certo é que o desafio final da fabricação de chips apenas começou.