noticias

¡El viejo Huang hace otro movimiento sorprendente!Se lanza el primer servidor GB20 "edición especial", que podría lanzarse el próximo año

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Nuevo informe de sabiduría

Editor: Departamento Editorial

[Introducción a la Nueva Sabiduría]Los medios extranjeros dieron la noticia de que Nvidia lanzará un chip de inteligencia artificial personalizado para el mercado chino el próximo año e incluso desarrollará un servidor que lo iguale. Esta es la primera vez en la historia de Nvidia.

¡La batalla entre Nvidia y el Departamento de Comercio de EE. UU. se ha intensificado nuevamente!

Bajo los controles de exportación de Estados Unidos, Lao Huang continúa ideando estrategias alternativas y se está desarrollando un juego del gato y el ratón.


Después de la implementación de nuevas regulaciones de control de exportaciones, Lao Huang no pudo ganar dinero en el mercado chino.

A partir de enero de este año, las nuevas regulaciones de exportación han estado implementadas durante exactamente un año, y la proporción del mercado chino en los ingresos de Nvidia ha caído al 17%. Hace dos años, esta cifra todavía era superior al 25%.

Ante la regulación, Nvidia ha lanzado continuamente chips de "edición especial" personalizados para China. Sin embargo, estos chips con un rendimiento debilitado a menudo no se venden bien.

Las ventas del H20, que había tenido un mal comienzo antes, apenas habían comenzado a aumentar, pero Nvidia se sorprendió al escuchar las malas noticias.

Los analistas de Jefferies revelaron en un informe de investigación la semana pasada que el Departamento de Comercio de EE. UU. llevará a cabo su revisión anual de las restricciones a la exportación de semiconductores en octubre y puede prohibir la exportación de chips H20.

La supervisión continúa aumentando y esta vez, Lao Huang dio lo mejor de sí.

No solo lanzó el nuevo chip insignia de IA B20, sino que, preocupado de que no fuera fácil de usar, también lanzó el servidor de soporte GB20.


No es difícil adivinar por el nombre que B20 es una variante del Blackwell B200 lanzado por Nvidia en marzo de este año.

Como la GPU más rápida hasta la fecha, la B200 puede procesar determinadas tareas hasta 30 veces más rápido que su predecesora. (por ejemplo, dejar que el chatbot genere respuestas)

Desafortunadamente, esto no tiene nada que ver con el chip B20 de "edición especial"...

El B20, que nació bajo las restricciones de la política de control de exportaciones de Estados Unidos, está destinado a ser un producto de nivel básico, en marcado contraste con el B200 con un rendimiento de IA líder en la industria.

Sin embargo, según la fuente, aunque el B20 será más lento que el B200 en el procesamiento de cálculos de IA, la instalación de una gran cantidad de chips juntos en el servidor GB20 puede compensar parcialmente esta deficiencia.

Esto garantizará que Nvidia mantenga un cierto grado de competitividad al competir con productos chinos, al mismo tiempo que cumpla con el límite superior de potencia informática de chip requerido por los controles de exportación de Estados Unidos.

Bajo control se desarrolla un "juego del gato y el ratón"

Desde finales de 2022, Nvidia ha reconfigurado repetidamente sus chips para el mercado chino, centrándose en las necesidades de los clientes chinos que necesitan chips para desarrollar LLM, tratando de seguir siendo atractivo para los clientes chinos y al mismo tiempo cumplir con las regulaciones estadounidenses.

En octubre de 2022, el gobierno de Estados Unidos prohibió la venta de los A100 y H100 de Nvidia, sus chips de inteligencia artificial más avanzados en ese momento.

Unos meses más tarde, Nvidia lanzó dos productos alternativos, A800 y H800, para el mercado chino.

Menos de un año después, el Departamento de Comercio de Estados Unidos actualizó una vez más sus medidas de control de exportaciones e impuso restricciones a estos dos chips.

Nvidia respondió rápidamente,


Entre ellos, el chip H20 tiene un rendimiento limitado pero una mayor velocidad de conexión. Con una memoria de gran ancho de banda y soporte de software maduro, ofrece un mejor rendimiento.

Aunque las ventas iniciales fueron escasas, cada vez más clientes chinos optan por comprar este chip.

Según cuatro personas directamente involucradas en las ventas de chips Nvidia en China, las empresas chinas han pedido más de 500.000 chips H20 por un valor total de casi 5.800 millones de dólares y se entregarán en 2024.

La firma de investigación SemiAnalysis también ha hecho estimaciones optimistas de que Nvidia venderá más de 1 millón de chips H20 en China este año, por un valor de más de 12 mil millones de dólares.

Pero como se mencionó anteriormente, este negocio enfrenta nuevas amenazas por parte del Departamento de Comercio. Cuando las regulaciones se ajusten a finales de año, es posible que se prohíba la venta de H20.

Esa prohibición podría adoptar muchas formas, incluidas prohibiciones de productos específicos, reducción de la potencia informática de un chip o limitación de su capacidad de memoria.

Después de todo, el contexto macroeconómico es tal que en general se espera que Estados Unidos siga ejerciendo presión sobre los controles de las exportaciones relacionadas con los semiconductores.

Estados Unidos quiere que los Países Bajos y Japón restrinjan aún más el suministro de equipos de fabricación de chips a China, dijeron las fuentes.


Bajo el creciente control, pueden aparecer cada vez más "ediciones especiales".


Se rumorea que Nvidia también está desarrollando una nueva tarjeta gráfica insignia para juegos, la RTX 5090D.


La tarjeta gráfica se diseñará específicamente para el mercado chino y es una continuación de la RTX 4090D, la primera tarjeta gráfica orientada al consumidor que cumple con los estándares de exportación.

El rendimiento del chip no es suficiente, se necesita el servidor para compensarlo

Las especificaciones específicas del B20 aún no se han determinado, pero lo que es seguro es que definitivamente no romperá el "techo" de la política de exportación de GPU de EE. UU.

Al igual que sus antiguos predecesores, los H20, L20 y L2 lanzados anteriormente, se puede decir que el rendimiento de estos tres chips es "épico". No sólo es deficiente, sino que además está equipado sólo con una versión residual de NVLink. conectar.

TPP y PD, dos indicadores importantes para bloquear la garganta

Estados Unidos tiene estrictas regulaciones de rendimiento para las exportaciones de GPU de China y utiliza un indicador llamado "Poder de procesamiento total" (TPP).

Esta métrica tiene en cuenta los TFLOPS y la precisión de la potencia informática de la GPU. Específicamente, multiplicar TFLOPS (sin escasez) por precisión (en bits) da TPP.

El límite actual está fijado en 4800 TPP, ¿qué significa esto?

Tomando como referencia los productos anteriores de NVIDIA: Hopper H100 y H200 han superado con creces este estándar. El TPP de ambas GPU ha alcanzado 16.000, que es más de tres veces el límite superior especificado.


Incluso el RTX 4090 supera el límite con su potencia informática FP8 de 660,6 TFLOPS.

La GPU de escritorio de Nvidia más potente que se mantiene dentro del límite de 4800 TPP es la RTX 4090D, que está diseñada específicamente para cumplir con las restricciones de exportación.


Blackwell ha establecido un nuevo punto de referencia en rendimiento informático, con su solución de doble chip probablemente producirá alrededor de 4.500 TFLOPS de potencia informática del FP8, lo que sería 7,5 veces el límite de exportación.

En otras palabras, ¡el rendimiento del B20 será menos de 1/7 del rendimiento del Blackwell B200!

No solo eso, B20 también enfrenta restricciones adicionales: restricciones de "densidad de rendimiento" (PD).

Esta es una restricción impuesta específicamente a las GPU de centros de datos en los Estados Unidos, y las GPU de consumo no se ven afectadas por esto.

El indicador PD se puede obtener dividiendo la puntuación TPP por el tamaño del chip. El PD de las GPU exportadas a China no debe ser superior a 6,0.

Según este indicador, las GPU de la serie RTX 40 (arquitectura Ada Lovelace) ya no se pueden utilizar en los centros de datos.

Blackwell es obviamente mejor que Ada Lovelace en términos de densidad y rendimiento.

En otras palabras, Nvidia necesita limitar estrictamente el rendimiento del B20 o utilizar una mayor proporción de chips para cumplir con las regulaciones pertinentes.

Según Tom's Hardware, el B20 será el sucesor de las GPU AI de nivel básico A30 y H20 de Nvidia.

Tomando el H20 como ejemplo, su potencia informática FP16 es de solo 296 TFLOPS, el TPP es de 2368, el PD es de solo 2,90, mientras que el H100/H200 es de 1979 TFLOPS.


Al mismo tiempo, el A30 tiene una puntuación TPP de 2640 y una puntuación PD de 3,20, que es ligeramente superior a la del H20.

Se puede ver que la GPU AI construida por Nvidia para el mercado chino tiene cierto margen de mejora en el rendimiento, pero el espacio es muy limitado.

En el mejor de los casos, Nvidia podría intentar crear una GPU con un TPP entre 4000 y 4500 y un tamaño de matriz de 800 milímetros cuadrados.

GB20: haga todo lo posible para conservar el rendimiento del B20

Para hacer que el próximo B20 sea más eficiente, Nvidia está empleando estrategias que utilizó con el H20, como actualizar la capacidad de la memoria, ya que los chips de memoria no están sujetos a los controles de exportación actuales.

Según dos personas involucradas en el desarrollo del servidor, Nvidia está trabajando para aumentar la velocidad de transferencia de datos entre la memoria y los procesadores B20, de modo que grandes conjuntos de datos energéticos puedan procesarse más rápidamente.

No solo eso, Nvidia también utilizará su tecnología NVLINK (que permite una comunicación rápida entre diferentes chips) y soluciones de refrigeración en el diseño del rack GB20.

Se espera que esto aumente la utilización de chips B20 y la eficacia de los clústeres informáticos GB20 para impulsar la inteligencia artificial, añadió el dúo.

El sistema GB20 permitirá a los clientes realizar entrenamiento e inferencia de IA ejecutando múltiples chips en paralelo de manera más eficiente.

Antes de que el GB20 fuera expuesto, Tom's Hardware predijo audazmente que el B20 sería un chip difícil de vender.

Pero ahora, con la bendición de GB20, parece haber nuevas esperanzas.

Referencias:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- regulaciones

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules