¡extraño! Informe: el último lanzamiento del chip AI de Nvidia se retrasó debido a fallas de diseño

¡extraño!Informe: El lanzamiento del último chip de inteligencia artificial de Nvidia se retrasó debido a fallas de diseño

2024-08-03

El chip de IA más avanzado de la nueva serie de chips Blackwell de Nvidia puede sufrir un retraso en su lanzamiento.

Según The Information, citando a personas familiarizadas con el asunto, el próximo chip de inteligencia artificial de NvidiaRetrasos de tres meses o más por fallos de diseño.

Esto podría afectar a clientes como Meta Platforms, Google y Microsoft, que en conjunto han pedido chips por valor de decenas de miles de millones de dólares.

Nvidia no quiso comentar sobre el anuncio sobre el retraso, pero dijo que los clientes están probando muestras de los chips Blackwell y que "se espera que la producción aumente" a finales de este año.

No es común que se descubran fallas de diseño importantes antes de la producción en masa.

The Information citó a personas involucradas en la producción de chips de Blackwell diciendo que en las últimas semanas han surgido problemas de diseño de Blackwell.Porque los ingenieros de TSMC descubrieron la falla mientras se preparaban para la producción en masa.

El chip GB200 contiene dos GPU Blackwell conectadas y una unidad central de procesamiento Grace. El defecto involucra un chip de procesador (una pieza de silicio utilizada para albergar los circuitos del chip) que está conectado a dos GPU Blackwell. El obstáculo reduce la cantidad de chips que TSMC puede producir para Nvidia e incluso puede provocar que la empresa detenga la producción.

Según los informes, Nvidia está llevando a cabo una nueva producción de prueba con su fabricante de chips TSMC.Para no dejar que la máquina se limite,TSMC ha reiniciado la producción de otro producto de alto perfil que se acerca a la producción en masa para resolver el problema.Esta situación también es rara.

Los analistas creen que es muy inusual que se descubran defectos de diseño importantes antes de la producción en masa. Porque se requieren múltiples pruebas de producción y simulaciones en la etapa inicial para garantizar la viabilidad del producto y un proceso de fabricación sin problemas.

Según el plan original, TSMC comenzará la producción en masa de chips Blackwell en el tercer trimestre y comenzará a entregarlos a Nvidia en el cuarto trimestre. Huang dijo en mayo que la compañía planeaba enviar grandes cantidades de Blackwell a finales de este año.

Este problema de defecto de diseño puede retrasar los chips principales de Blackwell (B200 y GB200) por 3 meses o más, y la producción en masa de Blackwell se retrasará hasta el primer trimestre del próximo año. Después de recibir los chips, los proveedores de la nube suelen tardar unos tres meses en poner en funcionamiento sus clústeres a gran escala.

Las expectativas de los gigantes se han visto defraudadas y aún no está claro cuándo se recibirá la mercancía.

Blackwell puede describirse como la "luz de luna blanca" en la mente de las empresas de tecnología, que alberga las grandes esperanzas de los gigantes.

Si los próximos chips de IA, como B100, B200 y GB200, se retrasan tres meses o más, los clientes de Nvidia pueden sentirse decepcionados.

Estos clientes incluyen Microsoft, Meta y OpenAI, etc. Tienen grandes expectativas para los chips de IA de Nvidia y planean utilizar las "supercomputadoras" desarrolladas por Nvidia para producir generaciones futuras de modelos de lenguaje a gran escala, asistentes de Meta AI y otras funciones automatizadas.

The Information citó a personas familiarizadas con el asunto diciendo que Meta había realizado pedidos por valor de al menos 10 mil millones de dólares, mientras que Microsoft había aumentado el tamaño de sus pedidos en un 20% en las últimas semanas. Microsoft planea tener entre 55.000 y 65.000 chips GB200 listos para OpenAI para el primer trimestre de 2025.

Evidentemente, se desconoce la fecha en la que Microsoft recibió estos pedidos.

Los bastidores de servidores NVLink pueden verse afectados

El defecto de diseño también afectará la producción y entrega de los racks de servidores Nvidia NVLink, ya que las empresas que trabajan en servidores deben esperar nuevas muestras de chips antes de finalizar los diseños de los racks de servidores.

Anteriormente, el analista de Tianfeng International, Ming-Chi Kuo, señaló que no hay dudas sobre la ventaja de potencia informática del GB200 NVL36, pero también enfrenta muchos desafíos de diseño y producción sin precedentes. La respuesta es dudosa si puede garantizar envíos a gran escala según lo programado. .

Cada gabinete de GB200 NVL36 consume alrededor de 80 kW de energía. Según una encuesta realizada por AMAX en abril de este año, actualmente menos del 5% de los centros de datos del mundo pueden admitir servidores de 50 kW por gabinete. Por lo tanto, antes de comprar GB200 NVL36, debe asegurarse de que haya suficiente espacio para la instalación.
La versión de gabinete único del GB200 NVL72 consume 130 kW por gabinete y no se puede producir en masa en el corto plazo.

noticias

¡extraño!Informe: El lanzamiento del último chip de inteligencia artificial de Nvidia se retrasó debido a fallas de diseño

Introducción

Mi informacion de contacto