notícias

Novo chip da Nvidia “atrasado”?Não entre em pânico, o impacto não será tão grande

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor deste artigo: Zhang Yifan

Editor: Shen Siqi

Fonte: IA difícil

O chip de nova geração da Nvidia, Blackwell, parece estar enfrentando alguns pequenos problemas.

Em 1º de agosto, a organização de pesquisa ALETHEIA informou que o chip Blackwell da Nvidia pode sofrer atrasos. Posteriormente, em 2 de agosto, o Morgan Stanley e o Morgan Stanley publicaram relatórios de análise. No geral, o impacto da latência do chip Blackwell não é tão ruim.

1. Ponto de vista de Xiaomo

• Motivo do atraso:Xiaomo acredita que existem três razões principais, entre as quais as questões de design de chips são a razão principal.
a. Problemas de design do chip B100/B200;
b. Problema de rendimento da embalagem CoWoS-L: apenas 60%, muito inferior ao nível do CoWoS-S de mais de 90%;
c. Problemas no nível do sistema: como aquecimento e vazamento de líquido;
• Impacto na cadeia de abastecimento:Espera-se que os atrasos no B100 durem um quarto, mas os prazos de envio do GB200 permanecem praticamente inalterados.
2. Perspectiva do Morgan Stanley
• Motivo do atraso: Damo acredita que isto não é um atraso, mas uma melhoria. A Nvidia espera melhorar ainda mais a estabilidade da Blackwell através de um “redesign”.
• Variedade:Devido a problemas de rendimento da embalagem CoWoS-L, o B200A mudará para a embalagem CoWoS-S.
• Impacto na cadeia de abastecimento:Embora a produção da Blackwell tenha sido suspensa por duas semanas na TSMC, o atraso pode ser recuperado após a expansão da capacidade no quarto trimestre e a Blackwell pode ser entregue dentro do prazo.

No geral, os atrasos nos chips da Nvidia se devem principalmente aProblemas de design de chips, baixo rendimento de embalagem CoWoS-L e problemas de nível de sistema (como aquecimento, vazamento de líquido, etc.)

3. Interpretação especializada

No fim de semana, o CEO da Ronghe Semiconductor, Wu Zihao, combinou seus muitos anos de experiência Fab e notícias da cadeia de suprimentos para escrever um artigo "Um registro completo do processo de substituição do chip Blackwell de nova geração da NVIDIA", explicando em detalhes os motivos do atraso e o impacto sobre A cadeia de suprimentos.

Wu Zihao disse que o chip "redesenhado" éb102 e b102 são a base de todos os chips Blackwell.

- b102: consiste em um chip GPU + 4 HBM3e;
- b100: composto por dois b102;
- Placa-mãe GB200: composta por dois processadores b100 + um Grace;
- Servidor: composto por placa-mãe e diversos acessórios de nível de sistema (resfriamento líquido, cabos de cobre, etc.);

O redesenho do chip básico subjacente (chip b102) iráIsso pode afetar placas-mãe, servidores subsequentes e até mesmo todo o cronograma de fornecimento.

4. Expectativas de atraso da Blackwell

Anteriormente, o mercado esperava que a Blackwell iniciasse a produção no terceiro trimestre, enviasse em lotes no quarto trimestre e enviasse oficialmente servidores em grandes quantidades no primeiro trimestre de 2025.

Tanto Xiaomo quanto Wu Zihao acreditam que o problema do chip pode afetar o cronograma de produção originalmente planejado para o terceiro trimestre, mas à medida que a TSMC expande sua capacidade de produção no quarto trimestre, o atraso no terceiro trimestre pode ser recuperado. No geral, embora as remessas da Blackwell diminuam este ano, não diminuirão muito e terão pouco impacto nas remessas de servidores no primeiro trimestre de 2025.

Vale ressaltar que é diferente das expectativas do mercado. A NVIDIA revelou em sua conferência de resultados do primeiro trimestre que os chips Blackwell começarão a ser produzidos no segundo trimestre e aumentarão gradualmente as remessas no terceiro trimestre. Espera-se que gerem receitas significativas para a Blackwell este ano. O relatório do Morgan Stanley também apontou que esse “redesenvolvimento” é na verdade uma melhoria do chip, e não um atraso.

Portanto, o mercado atualmente tem diferentes interpretações do plano específico de programação de produção da TSMC. Se a produção começar no segundo trimestre e aumentar gradualmente no terceiro trimestre, então este atraso poderá de facto ter algum impacto na cadeia de abastecimento.

5. Outras questões

• Problemas de rendimento da embalagem CoWoS-L: Xiaomo disse que a taxa de rendimento do CoWoS-L foi de apenas 60%, mas após a confirmação de Wu Zihao e da equipe de pesquisa Nomura, a taxa de rendimento real foi superior a 90%. Além disso, fabricantes Fabless como a Nvidia geralmente têm Plano B. Como Damon mencionou, eles usarão o pacote CoWoS-S (a taxa de rendimento atual é de 99%) para substituir o CoWoS-L, o que não afetará as remessas de servidores.
• Problemas de febre:O Morgan Stanley acredita que questões como dissipação de calor e alta tensão são comuns durante a introdução de novos produtos e não se espera que tenham um impacto substancial nos planos de produção em massa, e a produção em massa prosseguirá de forma ordenada.
• Problema de vazamento de líquido:Entre as principais partes da dissipação de calor resfriada a água, como placas resfriadas a água, tubos ramificados, CDUs e conectores rápidos (QCD), é mais provável que ocorra vazamento nos conectores rápidos, e a situação específica ficará mais clara após a introdução real .
6. Impacto na cadeia de abastecimento
• Nvidia: O pico de remessas de servidores da série H entrará no segundo semestre de 2024. Os servidores equipados com chips da série H são a principal fonte de desempenho da Nvidia este ano. A Blackwell não tinha previsão de receita para o terceiro trimestre deste ano e as remessas de servidores da Blackwell não foram altas no quarto trimestre. As remessas de servidores foram originalmente programadas para 2025, portanto o impacto geral no desempenho da Nvidia será pequeno.
• TSMC:Espera-se que o CoWoS-L, que foi originalmente planejado para produção em massa este ano, seja revisado para baixo em 20.000 peças (de mais de 40.000 peças para 20.000 peças), o que se refletirá no desempenho do quarto trimestre ou do primeiro trimestre da TSMC no próximo ano.
• Módulo óptico:O B100 está equipado com módulos ópticos de 800G como padrão, mas o envio de módulos ópticos que suportam servidores não terá impacto na demanda de 800G em 2024/2025.

No geral, o atraso do chip Nvidia Blackwell se deve principalmente a problemas de design do chip, e o impacto não é tão sério quanto inicialmente imaginado. Não é que haverá atrasos de vários meses na cadeia de abastecimento, e o rendimento da embalagem CoWoS-L não é tão baixo quanto os rumores do mercado. Como a Nvidia disse em uma entrevista: “Os testes de amostra da Blackwell começaram extensivamente e a produção deverá aumentar na segunda metade do ano”.