noticias

¿El nuevo chip de Nvidia se "retrasó"?Que no cunda el pánico, el impacto no será tan grande

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor de este artículo: Zhang Yifan

Editor: Shen Siqi

Fuente: IA dura

El chip de nueva generación de Nvidia, Blackwell, parece estar teniendo algunos problemas menores.

El 1 de agosto, la organización de investigación ALETHEIA informó que el chip Blackwell de Nvidia podría sufrir un retraso. Posteriormente, el 2 de agosto, Morgan Stanley y Morgan Stanley publicaron cada uno informes de análisis. En general, el impacto de la latencia del chip Blackwell no es tan malo.

1. El punto de vista de Xiaomo

• Motivo del retraso:Xiaomo cree que hay tres razones principales, entre las cuales los problemas de diseño del chip son la razón principal.
a. Problemas de diseño del chip B100/B200;
b. Problema de rendimiento del envasado de CoWoS-L: solo 60 %, muy por debajo del nivel de CoWoS-S de más del 90 %;
c. Problemas a nivel del sistema: como calentamiento y fugas de líquido;
• Impacto en la cadena de suministro:Se espera que los retrasos para el B100 duren un trimestre, pero los tiempos de envío para el GB200 se mantienen prácticamente sin cambios.
2. La perspectiva de Morgan Stanley
• Motivo del retraso: Damo cree que esto no es un retraso, sino una mejora. Nvidia espera mejorar aún más la estabilidad de Blackwell mediante un "rediseño".
• Variedad:Debido a problemas de rendimiento del empaque CoWoS-L, B200A cambiará al empaque CoWoS-S.
• Impacto en la cadena de suministro:Aunque la producción de Blackwell se suspendió durante dos semanas en TSMC, el retraso se puede recuperar después de la expansión de la capacidad en el cuarto trimestre y Blackwell se puede entregar según lo previsto.

En general, los retrasos en los chips de Nvidia se deben principalmente aProblemas de diseño de chips, bajo rendimiento del empaque CoWoS-L y problemas a nivel del sistema (como calentamiento, fugas de líquido, etc.)

3. Interpretación experta

Durante el fin de semana, el director ejecutivo de Ronghe Semiconductor, Wu Zihao, combinó sus muchos años de experiencia en Fab y noticias sobre la cadena de suministro para escribir un artículo "Un registro completo del proceso de transferencia Blackwell del chip de nueva generación de NVIDIA", que explica en detalle las razones del retraso y el impacto en la cadena de suministros.

Wu Zihao dijo que el chip "rediseñado" esb102 y b102 es la base de todos los chips Blackwell.

- b102: consta de un chip GPU + 4 HBM3e;
- b100: compuesto por dos b102;
- Placa base GB200: compuesta por dos CPU b100 + una Grace;
- Servidor: compuesto por placa base y diversos accesorios a nivel de sistema (refrigeración líquida, cables de cobre, etc.);

El rediseño del chip básico subyacente (chip b102)Puede afectar a las placas base y servidores posteriores e incluso a todo el programa de suministro.

4. Blackwell retrasa las expectativas

Anteriormente, el mercado esperaba que Blackwell comenzara la producción en el tercer trimestre, se enviara en lotes en el cuarto trimestre y enviara oficialmente servidores en grandes cantidades en el primer trimestre de 2025.

Tanto Xiaomo como Wu Zihao creen que el problema del chip puede afectar el programa de producción originalmente planeado para el tercer trimestre, pero a medida que TSMC expanda su capacidad de producción en el cuarto trimestre, el retraso en el tercer trimestre se podrá recuperar. En general, aunque los envíos de Blackwell disminuirán este año, no disminuirán mucho y tendrá poco impacto en los envíos de servidores en el primer trimestre de 2025.

Vale la pena señalar que difiere de las expectativas del mercado. NVIDIA reveló en su conferencia de resultados del primer trimestre que los chips Blackwell comenzarán a producirse en el segundo trimestre y aumentarán gradualmente los envíos en el tercer trimestre. Se espera que generen importantes ingresos de Blackwell este año. El informe de Morgan Stanley también señaló que este "rediseño" es en realidad una mejora del chip y no un retraso.

Por lo tanto, el mercado tiene actualmente diferentes interpretaciones del plan de programación de producción específico de TSMC. Si la producción comienza en el segundo trimestre y aumenta gradualmente en el tercero, entonces este retraso puede tener algún impacto en la cadena de suministro.

5. Otras preguntas

• Problemas de rendimiento del embalaje CoWoS-L: Xiaomo dijo que la tasa de rendimiento de CoWoS-L era solo del 60%, pero después de la confirmación de Wu Zihao y el equipo de investigación de Nomura, la tasa de rendimiento real superó el 90%. Además, los fabricantes de Fabless como Nvidia suelen tener el Plan B. Como mencionó Damon, utilizarán el paquete CoWoS-S (la tasa de rendimiento actual es del 99%) para reemplazar CoWoS-L, lo que no afectará los envíos de servidores.
• Problemas de fiebre:Morgan Stanley cree que problemas como la disipación de calor y el alto voltaje son comunes durante la introducción de nuevos productos y no se espera que tengan un impacto sustancial en los planes de producción en masa, y la producción en masa se llevará a cabo de manera ordenada.
• Problema de fuga de líquido:Entre las partes principales de la disipación de calor enfriadas por agua, como placas, ramales, CDU y conectores rápidos (QCD) enfriados por agua, es más probable que se produzcan fugas en los conectores rápidos y la situación específica quedará más clara después de la introducción real. .
6. Impacto en la cadena de suministro
•Nvidia: El pico de envío de servidores de la serie H se producirá en la segunda mitad de 2024. Los servidores equipados con chips de la serie H son la principal fuente de rendimiento de Nvidia este año. Blackwell no tenía pronósticos de ingresos para el tercer trimestre de este año y los envíos de servidores Blackwell no fueron altos en el cuarto trimestre. Los envíos de servidores estaban programados originalmente para 2025, por lo que el impacto general en el rendimiento de Nvidia será pequeño.
•TSMC:Se espera que CoWoS-L, que originalmente estaba previsto para su producción en masa este año, se revise a la baja en 20.000 piezas (de más de 40.000 piezas a 20.000 piezas), lo que se reflejará en el desempeño del cuarto o primer trimestre de TSMC el próximo año.
• Módulo óptico:B100 está equipado con módulos ópticos de 800G de serie, pero el envío de módulos ópticos que admitan servidores no tendrá ningún impacto en la demanda de 800G en 2024/2025.

En general, el retraso del chip Nvidia Blackwell se debe principalmente a problemas de diseño del chip y el impacto no es tan grave como se imaginó inicialmente. No es que haya retrasos en la cadena de suministro de varios meses y el rendimiento del embalaje CoWoS-L no es tan bajo como los rumores del mercado. Como dijo Nvidia en una entrevista: "Las pruebas de muestra de Blackwell han comenzado extensamente y se espera que la producción aumente en la segunda mitad del año".