noticias

3 billones de empresas de chips, ¿están también tratando de sobrevivir?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia planea volver a producir chips especiales de IA para el mercado chino.

Según el último informe de Reuters, personas familiarizadas con el asunto dijeron que Intel está desarrollando un nuevo chip insignia de IA para el mercado chino que cumple con los requisitos de los controles de exportación actuales de EE. UU. y agrega otro miembro a la línea de chips especiales nacionales de Nvidia.

Vale la pena mencionar que Nvidia lanzó la serie "Blackwell" en marzo de este año y se espera que se produzca en masa a finales de este año. Según Nvidia, el B200 es 30 veces más rápido que su predecesor en ciertas tareas. de los mejores chips de IA disponibles actualmente.

Este nuevo chip insignia especial también está relacionado con el B200. Las fuentes dijeron que Nvidia cooperará con Inspur Group, uno de sus principales socios de distribución en China, para lanzar y distribuir este chip, tentativamente llamado "B20". Puede tener algunas características del B200.

Contando este B20, en poco más de un año, Nvidia ha lanzado siete u ocho chips especiales para el mercado chino.

A800 y H800

El 7 de octubre de 2022, el gobierno de Estados Unidos anunció una serie de medidas de control de exportaciones, incluido el corte del suministro de ciertos chips semiconductores y equipos de fabricación de chips a China.

Además de afectar a los equipos de producción, como las máquinas de fotolitografía, también restringe el acceso de China a chips de inteligencia artificial y de alta informática bajo procesos avanzados, incluida la prohibición de que empresas estadounidenses como Nvidia y AMD vendan dichos chips a China, y también restringe la inteligencia artificial de China. "Las empresas de chips realizan grabaciones en fábricas extranjeras con tecnología estadounidense".

Esta restricción a la exportación afectó tanto a Nvidia como a AMD.

Nvidia dijo después de que se introdujeron las restricciones que la prohibición afectaba a sus chips A100 y H100 diseñados para acelerar las tareas de aprendizaje automático y podría obstaculizar la finalización del desarrollo de su chip insignia H100 que se lanzará en 2022. Señaló que las ventas de los chips afectados en China durante el trimestre alcanzaron los 400 millones de dólares estadounidenses. Si las empresas chinas deciden no comprar los productos de reemplazo de Nvidia, este dinero se perderá en vano.

Entonces, ¿exactamente cómo restringen las restricciones a la exportación de Estados Unidos los chips Nvidia?

Según las reglas de restricción de exportaciones para circuitos integrados de computación avanzada (ECCN 3A090 y 4A090) emitidas por el Departamento de Comercio de EE. UU. el 7 de octubre de 2022, la lista de artículos controlados debe cumplir las siguientes condiciones:

a. Circuitos integrados con una velocidad de transferencia bidireccional total de todas las entradas y salidas, o programables, de 600 GB/s o más, distintos de la memoria volátil, y cualquiera de los siguientes circuitos integrados:

a.1. Una o más unidades procesadoras digitales que ejecutan instrucciones de máquina, la longitud de bits de cada operación multiplicada por el rendimiento de procesamiento en TOPS, y la suma de todas las unidades procesadoras es 4800 o más;

a.2. Una o más "unidades informáticas en bruto" digitales (excluidas las unidades que ayudan en la ejecución de instrucciones de máquina relacionadas con el cálculo de los TOPS del subartículo 3A090.a.1) cuya longitud de bits por operación se multiplica por la suma de todas las unidades informáticas. El rendimiento del procesamiento TOPS es 4800 o superior;

a.3. Una o más "unidades informáticas originales" de simulación, de valores múltiples o de niveles múltiples cuyo rendimiento de procesamiento se calcula como TOPS multiplicado por 8, y el total de todas las unidades informáticas alcanza o supera 4800;

a.4. Cualquier combinación de unidades procesadoras digitales y "unidades informáticas originales" cuya suma calculada de conformidad con los artículos 3A090.a.1, 3A090.a.2 y 3A090.a.3 ascienda a 4800 o más.

El circuito integrado descrito en el subartículo 3A090.a incluye una unidad de procesamiento de gráficos (GPU), una unidad de procesamiento tensorial (TPU), un procesador neuronal, un procesador de memoria, un procesador de visión, un procesador de texto, un coprocesador/acelerador, dispositivos de procesamiento adaptativo y dispositivos lógicos programables en campo. (FPLD) y circuitos integrados de aplicación específica (ASIC).

No es difícil ver que el más importante es el límite de velocidad de interconexión de chips. De acuerdo con esta regulación, el A100 más vendido de NVIDIA cayó con precisión dentro del límite y su velocidad de transferencia entre chips alcanzó los 600 GB/s. Hasta cierto punto, quizás el Departamento de Comercio de Estados Unidos designó esta restricción basándose en el A100.

Para hacer frente a los controles de exportación, NVIDIA rápidamente castró un reemplazo para el A100-A800. La prohibición de EE. UU. se anunció oficialmente el 7 de octubre de 2022 y, un mes después, NVIDIA ideó el A800 que se puede decir que se adapta a las nuevas regulaciones. Aunque en el pasado se adaptaba a las condiciones locales, ahora se adapta a las condiciones políticas.

Según las especificaciones, la NVIDIA A800 utilizará la misma arquitectura de chip que la GPU Ampere A100. Estará disponible en tres versiones, dos versiones PCIe de 40 GB y 80 GB, y una versión SXM de 80 GB. Estas GPU proporcionarán hasta 9,7 TFLOP de FP64, 19,5 TFLOP de FP64 Tensor Core, 19,5 TFLOP de FP32, 156 TFLOP. (escasez de 312 TFLOP) TF32, 312 TFLOP (escasez de 624 TFLOP) BFLOAT16 y 624 TOPS (escasez de 1248 TOP) rendimiento INT8. La versión de 40 GB cuenta con memoria HBM2 con un ancho de banda de hasta 1.555 TB/s, mientras que la versión de 80 GB cuenta con HBM2e con un ancho de banda de hasta 2 TB/s.

Por supuesto, para satisfacer la demanda limitada, el ancho de banda inevitablemente se ha reducido, de los 600 GB/s originales a 400 GB/s. Un portavoz de Nvidia dijo en un comunicado a Reuters: "La GPU A800 se puso en funcionamiento en el. En el tercer trimestre, una alternativa a la GPU A100 para los clientes chinos, el A800 cumple con las pruebas explícitas del gobierno de EE. UU. para la reducción del control de exportaciones y no se puede programar más allá de ese estándar.

Wayne Lam, analista de CCS Insight, comentó: "El A800 parece ser una GPU A100 reempaquetada diseñada para evitar las recientes restricciones comerciales del Departamento de Comercio", al tiempo que señaló que el 8 es un número de la suerte en China.

"China es un mercado importante para Nvidia, y tiene sentido comercial reconfigurar el producto para evitar restricciones comerciales", dijo Lam, quien dijo que las capacidades de comunicación entre chips del A800 se redujeron significativamente para los centros de datos que utilizan miles de chips.

En el siguiente H100, Nvidia hizo lo mismo y creó el H800. En el A100, Nvidia redujo la interconexión de 600 GB/s de la GPU a 400 GB/s, e hizo lo mismo con el H100. Según los informes, la velocidad de interconexión del chip del H800 se ha reducido a aproximadamente la mitad que la del H100, es decir, de 800 GB/s a 400 GB/s. En comparación con el A800, el rendimiento del H800 tiene un mayor impacto. Después de todo, el primero solo se reduce en un 33% y el segundo en un 50%.

En ese momento, un portavoz de NVIDIA se negó a revelar la diferencia entre el H800 y el H100 para el mercado chino y se limitó a decir que "nuestros productos de la serie 800 cumplen plenamente con las normas de control de exportaciones".

Cuando los fabricantes extranjeros compran frenéticamente A100 y H100, los fabricantes nacionales solo pueden elegir H800 y A800 con configuraciones más bajas. La versión especial del chip de NVIDIA ha restringido hasta cierto punto el desarrollo de grandes modelos nacionales de IA.

H20 y RTX 4090D

Para las empresas nacionales, A800 y H800 tienen cualidades buenas y malas. Lo malo es que después de cortar el ancho de banda de Internet, el rendimiento de estos dos chips es un poco peor y la velocidad de entrenamiento también es mucho más lenta. Son buenos y malos. Se puede pedir a través de los canales de Zhengcheng, pero en comparación con las empresas extranjeras, el costo de los chips será mayor.

Pero el A800 y el H800 tampoco duraron más de un año. El 17 de octubre de 2023, el Departamento de Comercio de EE. UU. emitió nuevas reglas de control para regular la exportación de circuitos integrados de computación avanzada, equipos de fabricación de semiconductores y artículos que respaldan aplicaciones y usos finales de supercomputación emitidas el 7 de octubre de 2022. Actualizaciones adicionales.

El principal de ellos son los cambios en los parámetros de control. La regla final provisional elimina el "ancho de banda de interconexión" como parámetro para identificar chips restringidos según ECCN 3A090 y, en su lugar, lo reemplaza con "ancho de banda de interconexión" como parámetro para identificar chips restringidos según ECCN 3A090 si el. El chip excede los dos parámetros calibrados en ECCN 3A090 (3A090. a y 3A090.b), la exportación estará restringida.

Según documentos del Departamento de Comercio de EE. UU., los parámetros regulatorios revisados ​​3A090.a regularán los circuitos integrados con una o más unidades de procesamiento digital, y se requiere que el "rendimiento de procesamiento total" de estas unidades sea 4800 o superior, o "procesamiento total". rendimiento" es 1600 o superior, y la "Densidad de rendimiento" es 5,92 o superior. El nuevo ECCN 3A090.b regulará los circuitos integrados con una o más unidades de procesamiento digital que deben tener una de las siguientes condiciones: un "rendimiento de procesamiento total" de 2400 o más pero menos de 4800 y una "densidad de rendimiento" de 1,6 o 1,6. o más pero menos de 5,92, o el "rendimiento de procesamiento total" es 1600 o más, y la "densidad de rendimiento" es 3,2 o más de 3,2 pero menos de 5,92.

Además, la regla crea una excepción de licencia que crea un nuevo "Aviso de excepción de licencia para informática avanzada" para circuitos integrados de consumo con capacidades de inteligencia artificial por debajo del umbral restrictivo. La excepción se aplica a dos productos, uno diseñado o chips vendidos para su uso en datos. Los centros de datos, siendo el segundo chips no diseñados ni vendidos para uso en centros de datos, tienen un "rendimiento de procesamiento total" de 4800 o superior.

En comparación con las reglas del 7 de octubre de 2022, las nuevas reglas han ampliado una vez más el alcance del control. Bajo las reglas duales de rendimiento de procesamiento total y densidad de rendimiento, tanto los productos castrados como los no castrados están incluidos en los controles de exportación. alcance, A800 y H800 se han visto afectados, mientras que otros productos de Nvidia también se han visto afectados. El L40 y L40S para el mercado de razonamiento, y el RTX 4090 en el campo de consumo también se han incluido en la prohibición.

Este fue un duro golpe para Nvidia, lo que significó que los principales productos vendidos por Nvidia en ese momento no podían venderse en China debido a los controles de exportación. Debe saber que en años anteriores, los ingresos del negocio de centros de datos del mercado chino representaban. aproximadamente los ingresos totales de Nvidia del 20% al 25%, y en el cuarto trimestre del año fiscal 2024, debido a los controles de exportación, los ingresos en el mercado chino se desplomaron a un solo dígito.

Indefensa, Nvidia sólo pudo volver a empuñar el machete.

El 16 de noviembre de 2023, un mes después del lanzamiento de las nuevas reglas, NVIDIA lanzó chips GPU especialmente para el mercado chino: H20, L20 y L2 se basan en la arquitectura Hopper de NVIDIA, mientras que L20 y L2 se basan en Ada. arquitectura.

Entre ellos, los dos chips L20 y L2 se han ajustado en función de L40 y L4 respectivamente. Dado que son arquitecturas antiguas y no se utilizan habitualmente en razonamiento y entrenamiento, no han recibido mucha atención. El H20 es más interesante. Aunque ha obtenido NVLink completo de 900 GB/s debido a que las nuevas regulaciones ya no limitan la velocidad de Internet, el rendimiento debe descontarse mucho según el analista Dylan Petal, incluso si el uso real del H20. La tasa puede alcanzar el 90%, pero su rendimiento en el entorno real de interconexión de múltiples tarjetas todavía está cerca del 50% del H100.

Para el RTX 4090 en el mercado de consumo, NVIDIA también lanzó un reemplazo: el RTX 4090D en diciembre del año pasado. Este chip especial que cumple con los controles de exportación de EE. UU. ha sido castrado en términos de núcleo CUDA y consumo de energía. 12,8%, el consumo de energía también se reduce de 450W a 425W, una reducción del 5,9%, todas las demás especificaciones principales siguen siendo las mismas.

Debido al ligero aumento en la frecuencia principal, en algunas pruebas comparativas, el rendimiento del 4090D es sólo alrededor de un 5% menor que el del 4090. En comparación con los chips AI, esta brecha parece estar dentro del rango aceptable.

Los cuatro chips especiales seguidos a finales de 2023 han aliviado en cierta medida la vergüenza de Nvidia China y han evitado que se quede sin productos para vender. Sin embargo, después de dos rondas de restricciones, las grandes empresas y las pequeñas y medianas empresas lo han hecho. Comenzó a buscar en otra parte. La salida es comprar chips nacionales, construir servidores en el extranjero o comprar H100/200 y A100 a través de canales no oficiales, lo que no tiene más remedio que extenderse entre los fabricantes nacionales.

Las habilidades con el cuchillo de Lao Huang

Los jugadores de bricolaje que estén familiarizados con las GPU para juegos no estarán demasiado familiarizados con las habilidades con el cuchillo de Lao Huang.

Tomemos un ejemplo relativamente reciente, un año después del lanzamiento de la serie RTX 20, para diferenciar mejor la línea de productos y responder al lanzamiento de nuevos productos de la serie RX5000 de AMD, Nvidia lanzó la serie RTX 20 Super.

Aunque también se basan en núcleos TU106 y TU104, Nvidia ha utilizado estos dos núcleos para crear cinco tarjetas gráficas, a saber, RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super y RTX 2080. Entre ellas, la brecha más pequeña se encuentra entre La brecha de rendimiento teórica entre el RTX 2060 Super con núcleo TU106 y el RTX 2070 es solo de aproximadamente el 5%, y los puntajes de ejecución reales y las pruebas de juego también son muy cercanos. Se puede decir que Nvidia ha llevado la castración al extremo.

Hoy en día, los chips especialmente modificados producidos por NVIDIA para China no son más que una repetición del pasado y un regreso a lo antiguo.

Además del B20 que mencionamos al principio, Nvidia también planea mostrar sus habilidades en el mercado de consumo. Según los informes, se espera que el RTX 5090D, una versión reducida del RTX 5090, se lance en enero de 2025. Se espera que se base en la arquitectura Blackwell de Nvidia. El uso del proceso 4NP de TSMC puede reducir las especificaciones centrales para eludir las restricciones de exportación de EE. UU.

Contando estos dos chips rumoreados, Nvidia ya tiene una enorme línea especial en China: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Algunas personas son bastante optimistas sobre las perspectivas de estos chips de edición especial, la organización de investigación SemiAnalysis estima que se espera que Nvidia venda más de 1 millón de chips H20 en China este año, por un valor de más de 12 mil millones de dólares.

Pero Nvidia todavía tiene mucho de qué preocuparse. Según un informe de los analistas de Jeffries, cuando Estados Unidos realice su revisión anual de los controles de exportación de semiconductores en octubre, es "muy probable" que prohíba las ventas de chips H20 de Nvidia a China. El analista dijo que la prohibición puede ser a través de "producto específico". prohibiciones, límites de capacidad informática más bajos y/o capacidad de memoria limitada" para implementar.

Además, las tarjetas de cumplimiento fabricadas artificialmente como H20 se basan esencialmente en la castración de núcleos existentes. Lo mismo ocurre con B20. Podría haberse utilizado como núcleo de H200 y B200, pero ahora solo se puede utilizar para vender productos especiales más baratos. ediciones, y es probable que la vida útil sea de solo más de un año, por lo que es un negocio que genera pérdidas, se mire como se mire.

Pero Nvidia no tiene salida. Sólo puede hacer todo lo posible para equilibrar las reglas y el mercado. ¿Pero cuántas empresas en China están dispuestas a pagar por los chips de edición especial que se cortan una y otra vez?