Cerco y supresión de Nvidia | Shen Krypton

Cerco y supresión de NVIDIA | Deep Krypton

2024-08-01

Texto ｜ Qiu Xiaofen

Entrevista ｜ Qiu Xiaofen y Yang Xiao

Editor｜Su Jianxun Yang Xuan

resistir

Un grupo secreto de WeChat se difunde de boca en boca entre personas de empresas de chips de IA en Zhangjiang, Shanghai. El nombre del grupo es "Domestic Chip Group Warming Group". Incluso los competidores intercambiarán información e intercambiarán recursos comerciales.

El "grupo de chips nacionales para el calor" ha delineado una zona de tregua, donde los colegas pueden hacer una tregua temporalmente y ayudarse unos a otros, simplemente porque todos tienen un enemigo común: NVIDIA.

Debido a la existencia de Nvidia, las ventas de las empresas nacionales de chips han experimentado un poco de humillación.

Li Ming (seudónimo) es un vendedor de una empresa nacional de GPU. Cuando comenzó el auge de la IA, fue a encontrarse con los clientes con confianza, pero no tuvo tiempo de saludarlos. El cliente comenzó a hacer preguntas:

"En comparación con el chip A100 de NVIDIA, ¿cuál es la diferencia entre sus cosas? NVIDIA tiene NVLink, ¿qué tiene usted?" (Nota del autor: NVLink conecta varios chips de GPU para evitar que los datos de la GPU se muevan a la CPU para realizar cálculos y mejorar la eficiencia informática)

Al ver que no podían impresionar a los clientes con sus productos y tecnologías, el equipo de Li Ming comenzó a pensar en formas de confiar en las conexiones y encontrar "personas más poderosas" para ejercer presión, pero los clientes todavía agitaron sus manos y dijeron: "Todavía queremos usar Nvidia."

NVIDIA A100, con 54 mil millones de transistores empaquetados en un área de 826 milímetros cuadrados, es la clave para abrir la caja mágica de los grandes modelos de IA.

El entrenamiento de modelos grandes es como "refinar elixires" en datos masivos, con el propósito de descubrir los patrones de cambios de datos;Usar chips NVIDIA para entrenar modelos grandes es como pedirle a cientos de millones de personas con un coeficiente intelectual de 200 que hagan cálculos, mientras que el efecto de otros chips solo equivale a pedirle a miles de personas con un coeficiente intelectual de 100 que hagan cálculos.

Imágenes de NVIDIA A100 del sitio web oficial de NVIDIA

Todas las principales empresas de tecnología se apresuran a comprar Nvidia. Quien tenga más GPU de gama alta de NVIDIA tendrá la oportunidad de entrenar modelos grandes más inteligentes.

La información pública muestra que OpenAI controla actualmente la mayor cantidad de GPU de gama alta de NVIDIA en el mundo, al menos 50.000 piezas, Google y Meta también son propietarios de clústeres Wanka (alrededor de 26.000 y es raro que exista Internet en China); Red con clústeres Wanka de GPU de gama alta de Nvidia. El más grande es ByteDance (13.000).

NVIDIA monopoliza los mejores recursos en la cadena industrial global: tiene la capacidad de fabricación de chips avanzados más abundante de TSMC, tiene el grupo de ingenieros de usuarios más grande del mundo y controla el alma informática de muchas empresas de IA.

El monopolio absoluto a menudo genera insatisfacción, ira y huida.

"¡Todos los que fabrican modelos grandes hoy básicamente están perdiendo dinero seriamente! ¡Solo uno está ganando dinero! NVIDIA", dijo enojado un experto de la industria——"¡El margen de beneficio de NVIDIA incomoda a todos los clientes y perjudica a la industria de la IA!".

El informe financiero muestra que el margen de beneficio bruto de Nvidia alcanzó el 71%, entre los cuales los populares productos de las series A100 y H100 tienen márgenes de beneficio bruto de hasta el 90%. Como empresa de hardware, Nvidia disfruta de márgenes de beneficio bruto más altos que las empresas de software de Internet.

Los altos precios y las enormes ganancias hicieron que los grandes clientes de Nvidia comenzaran a huir. El 30 de julio, Apple anunció que su modelo de IA había sido entrenado con 8.000 TPU de Google, mientras que el contenido de NVIDIA era 0. Tan pronto como se conoció la noticia, el precio de las acciones de NVIDIA cayó más del 7% el 31 de julio, la mayor caída del pasado. tres meses y su valor de mercado se evaporó 193 mil millones de dólares.Casi pierdo un Pinduoduo.

Gráfico de caída del precio de las acciones de NVIDIA en el último año

Para todas las empresas nacionales de GPU que quieren arrancarle un trozo de carne a Nvidia, 2022 es un año decisivo. Se han emitido varias rondas de prohibiciones en los Estados Unidos, obligada a ganarse la vida y continúa lanzando versiones castradas de chips. en China, pero rápidamente se vuelven a prohibir:

En septiembre de 2022, se prohibió la exportación del A100/H00 a China, y NVIDIA lanzó la versión castrada A800/H800 en octubre de 2023, y se prohibió la exportación del A800/H800/L40/L40S/RTX4090 a China en junio de 2024; El fundador de NVIDIA, Huang Jenxun, dijo que impulsará versiones castradas de los chips L20 y H20 a China.

Sin embargo, la versión castrada provocó una condena más intensa por parte de la industria. El próximo H20 de Nvidia cuesta la mitad del precio del H100 de Nvidia, pero su rendimiento es sólo 1/3 del primero. Una persona de la industria de la IA denunció airadamente: " ¿No es esto solo robar dinero? ¡Impuesto puro sobre el coeficiente intelectual! "

Cuando los clientes de Nvidia se sintieron insatisfechos y enojados, las empresas nacionales de chips que querían reemplazar a Nvidia se sintieron "alimentadas" por esta emoción.

En el pasado, sólo podían seguir el trasero de Nvidia y comerse un pedacito del pastel. Según datos de la empresa de análisis de semiconductores TechInsights, la participación de mercado de Nvidia en los envíos de GPU para centros de datos alcanzará el 98% en 2023. Los chips nacionales y todos los gigantes de chips combinados,Sólo un exiguo 2%.

Ahora que ha llegado la prohibición, la Nvidia perfecta ha quedado destrozada en el mercado chino. ¿Quién puede reemplazar a Nvidia? Los fabricantes nacionales de chips de IA ven esperanza.

“Este año se ha liberado el 90% del mercado de NVIDIA en China.Si puedes agarrarlo o no depende de tu habilidad.", dijo el fundador de una empresa nacional de GPU.

36 Krypton publicó una vez "Deep Krypton | CATL: Cracks in the Trillion Battery Empire" en 2021. En la industria de las baterías eléctricas, CATL no tiene paralelo y está siendo observado por sus competidores.

Hoy en día, muchos pares también consideran a Nvidia, que es el jugador dominante en el campo de los chips de IA, una espina en la carne. Sin embargo, la diferencia entre Nvidia y Nvidia es que sus barreras son más altas y la brecha con sus oponentes es mayor. aún más amplio.

Intentamos encontrar las "grietas en NVIDIA" a través de la resistencia de los oponentes de NVIDIA. Si observamos la industria de GPU, aunque los fabricantes nacionales de GPU y chips de IA son débiles, entienden mejor el mercado chino y sus métodos de juego están más localizados; Intel, AMD, etc. Los gigantes de chips establecidos tienen munición más suficiente para enfrentarse frontalmente a Nvidia.

A corto plazo, Nvidia no será derrotada, pero no saldrá ilesa. Esta está destinada a ser una guerra sangrienta.

Fugarse

Si quieres abrirte paso, debes encontrar las debilidades de tu oponente.Una de las debilidades de Nvidia: la arrogancia.

La industria de los chips es esencialmente una industria de software To B. Los clientes necesitan servicios "acompañantes" de los fabricantes de chips, como depurar el hardware y hacer que el software y el hardware sean compatibles. Sólo cuando existe la compañía los clientes pueden volverse pegajosos y los productos de chips no serán fáciles de reemplazar.

Sin embargo, muchos expertos nacionales en chips dijeron a 36Kr que en el mercado chino, excepto para los grandes compradores con miles de millones de escala, como BAT y Byte, es casi difícil para la mayoría de las otras empresas obtener inversiones de Nvidia, incluso si su volumen de transacciones alcanza decenas de millones. . Servicio postventa.

En otras palabras, cuando los ingenieros chinos que utilizan chips NVIDIA tienen dudas, solo pueden confiar en sí mismos para buscar documentos en el sitio web oficial de NVIDIA o ir a la comunidad para aprender por sí mismos.

Al cooperar con NVIDIA, a menudo no se satisfacen las diversas necesidades de los clientes chinos.Una persona de la industria de los chips le dijo a 36Kr que Nvidia generalmente promueve las soluciones completas más caras y de gama más alta en China. Cuando los clientes realizan solicitudes personalizadas para escenarios específicos, generalmente son rechazadas después de comprar la tarjeta, los clientes tienen que "pensar". Hágalo usted mismo o busque una poderosa empresa de algoritmos para hacerlo".

Este enfoque de Nvidia ha acumulado muchas quejas de pequeños y medianos clientes. "Nvidia, como gran fabricante actual, ya no presta tanta atención a los pequeños clientes como antes. Sus productos no tienen rivales y no necesitan trabajar duro para complacer a los clientes", dijo la persona mencionada anteriormente.

Pero en el pasado, el auge del ecosistema NVIDIA en realidad confirmó la importancia de los servicios para la industria de los chips: en 2006, cuando recién comenzó el ecosistema CUDA, los productos NVIDIA no eran tan buenos como los chips nacionales actuales. Pero el equipo de NVIDIA comenzó primero con los equipos de investigación científica de las universidades y luego penetró en empresas de nueva creación en cada subsector para adaptar software y hardware, y solo entonces se convirtió en un país grande hoy.

NVIDIA H100 Fuente: sitio web oficial de NVIDIA

Los fabricantes chinos de chips también se han dado cuenta de esto y están intentando empezar con el servicio al cliente.

Cierta empresa nacional de chips de IA que desea permanecer en el anonimato ha estado intentando desde 2023 llevar al personal de I+D de back-end a la primera línea para proporcionar servicios personales, no solo para estar en el sitio para una capacitación conjunta, sino también para brindar a los clientes una Equipo dedicado de personal de I+D después de realizar el pedido de venta en un grupo pequeño. Los precios unitarios para los clientes varían desde unos pocos millones hasta cientos de miles, y usted puede disfrutar de consultas las 24 horas, los 7 días de la semana.

Ofrecer simplemente servicios localizados y considerados está lejos de ser suficiente después de la retirada de NVIDIA de China.La industria de los chips ya no es simplemente una batalla entre los propios productos de chips. , pero también pone a prueba su respectiva comprensión de la ventana de tiempo. Los fabricantes chinos de chips se abalanzaron sobre ellos como una manada de lobos y comenzaron las vigorosas ofertas.

Huawei es el que viene con más fuerza. Huawei se asoció anteriormente con iFlytek para lanzar el dispositivo "Spark All-in-One", que estaba equipado con el "Ascend 910B".

Alguna vez se dijo que este chip era "comparable a NVIDIA A100" en términos de capacidades de tarjeta única. Lo que no se sabe es el lado difícil detrás del glorioso caso: 36 Krypton se enteró de que Huawei no dudó en pagar los costos laborales y desplegó cientos de ingenieros para ayudar a iFlytek a ajustar los parámetros.

Huawei e iFlytek lanzan la máquina todo en uno Spark, fuente: iFlytek

Aunque la industria lo llama "hecho a mano", tan pronto como salió el caso de referencia, muchas grandes empresas de modelos y empresas de Internet extendieron una rama de olivo a Huawei para realizar pruebas.

Una empresa nacional de venta de chips se sorprendió al descubrir que, desde julio del año pasado, se puede ver a la alta dirección de Huawei estacionada allí en cualquier proyecto de centro de computación inteligente que haya sido licitado públicamente. “Huawei ahora puede enviar cientos de personas a un proyecto. subir a servir e incluso perder dinero en algunos proyectos clave para obtener ingresos de otros proyectos".

La empresa de chips anónima antes mencionada también cuenta con 200 vendedores incondicionales, una configuración muy poco común en la industria nacional de chips. Su equipo de ventas partió de los tres campos más candentes para la implementación de modelos grandes, las finanzas, el derecho y la industria, y apareció en casi todas las exposiciones relacionadas con la potencia informática "En la industria de los chips, los recursos son lo primero. Si corres lentamente, morirás". ." Perdido".

También ha comenzado una guerra de precios oculta por los chips nacionales.

Una persona de la industria de los chips dijo a 36Kr que su objetivo es conseguir más pedidos de centros informáticos inteligentes de referencia, independientemente del precio unitario. 36 Krypton ha observado que para reducir costos, algunas empresas nacionales no dudan en eliminar la costosa HBM (memoria de alto ancho de banda) de sus tarjetas de inferencia, e inclusoSe envía a un precio un 50% inferior al precio de coste.

"Pase lo que pase, todo el mundo todavía espera abrirse paso desde varios puntos de entrada y cada uno tomar un pequeño trozo del pastel de NVIDIA, para que NVIDIA ya no sea la única".

Pero la realidad es cruel. Cuando se trata de productos, los chips de IA nacionales inevitablemente tendrán varios problemas.

Un experto en chips le dio un ejemplo a 36Kr: puede que solo se necesiten diez días para procesar el mismo conjunto de datos utilizando el clúster A100 de NVIDIA, pero pueden llevar varios meses utilizar algunos productos de chips nacionales.El tiempo de acumulación del hardware de chips nacional es demasiado corto y faltan procesos avanzados y brechas de hardware, lo que resulta en una baja eficiencia.

Las deficiencias del software también son obvias. Otro miembro de la industria probó y descubrió que cuando se usan chips domésticos para ejecutar modelos grandes, si desea realizar aplicaciones más interesantes en ellos, una vez que se cambia el modelo grande básico, los chips domésticos son propensos a fallar "En muchos casos, usamos. chips domésticos. "Básicamente, te tapas la nariz y la usas".

Ahora, cada empresa ha visto realmente claramente la estrategia de "cerco y supresión" que tiene entre manos y se ha diferenciado gradualmente hacia caminos más realistas:

Aunque todavía hay algunas facciones que continúan moviéndose al clúster Wanka, enfocándose en escenarios de entrenamiento y siendo duras con NVIDIA, representadas por Moore Threads y Huawei, la mayoría de las facciones optan por centrarse más en el uso de modelos grandes; Modelos pequeños en varias industrias La implementación de varias industrias comienza a partir de escenarios de razonamiento que no requieren alto hardware y software, representados por Suiyuan, Tianshu Zhixin, etc.

(36Kr Nota: Los modelos grandes tienen dos vínculos: entrenamiento e inferencia: el entrenamiento es el proceso de encontrar patrones en miles de millones de bases de datos."hacer"Modelo grande; la inferencia está en"usar"El proceso de modelos grandes es menos difícil yMenores requisitos de hardware y software., conexión más estrecha con la industria)

Moore Thread lanza el clúster Kua'e Wanka en la Conferencia de Inteligencia Artificial de 2024 36 toma de criptón

"No estamos persiguiendo ciegamente a Nvidia ahora. No podemos darnos el lujo de ponernos al día y no nos atrevemos a fabricar ciegamente chips con una potencia informática extremadamente grande", dijo sin rodeos una persona de la industria de chips.

Una consideración realista para los fabricantes nacionales de chips es que la tecnología de NvidiaEl foco principal no está aquí y los fabricantes nacionales han evitado la guerra frontal de Nvidia.

Anteriormente, la mayoría de las empresas utilizaban las tarjetas gráficas para juegos 4090 de consumo de NVIDIA para ejecutar inferencias basadas en consideraciones de costos. Estas tarjetas tenían muchos problemas: consumo excesivo de energía, memoria insuficiente y estar deshabilitadas. Los funcionarios de Nvidia tampoco permiten que estas tarjetas gráficas de consumo se utilicen para inferencias de modelos grandes.

Las empresas nacionales de chips han entrado en la brecha de NVIDIA. Tianshu Zhixin y Suiyuan están impulsando tarjetas de inferencia que compiten con el 4090 este año, con los puntos de venta de gran memoria, bajo consumo de energía y suministro estable.

Los fabricantes nacionales de chips también han dejado clara la importancia de identificar segmentos de mercado. Por ejemplo, para algunos escenarios sensibles al consumo de energía, nos centramos en chips pequeños de bajo consumo o podemos sumergirnos en escenarios especializados, como la optimización de vídeo, para hacer negocios pequeños pero atractivos;

El campo de batalla de los gigantes está tenso.

Cuando las empresas nacionales de GPU escriben "superando a NVIDIA" en PPT, se parece más a una hermosa visión. Este grupo de empresas no se ha establecido durante mucho tiempo y se ha puesto al día con la tendencia de sustitución nacional. , se considera una hazaña. Nvidia es a la vez un rival y un punto de referencia para ellos.

Pero cuando se trata de Intel y AMD, que son comparables en antigüedad a Nvidia, la atmósfera es aún más tensa.

“Internamente vemos a Nvidia como nuestro enemigo mortal", dijo a 36Kr un desarrollador de la línea de productos de la serie MI de AMD.

En el Taipei Computer Show (Computex 2024) en junio de este año, la fundadora de AMD, Su Zifeng (también es prima del fundador de Nvidia, Huang Jen-Hsun), también aclaró por primera vez el ritmo futuro de los productos AMD en GPU: iterando uno nuevo. Cada año, los productos GPU son consistentes con el ritmo de actualización de Nvidia.

Casi cada vez que Nvidia lanza una GPU, AMD la compra del mercado y la desmonta inmediatamente para compararla con productos que aún no se han lanzado.

“Necesitamos agregar algunas características (indicadores) aquí y elevar los parámetros allá”. Lo que persiguen es que “el hardware no pueda quedarse atrás de NVIDIA y los parámetros sean ligeramente mejores”, mencionó la mencionada persona a 36 Krypton.

Su Zifeng lanzó Instinct MI325X en Taipei Computex de este año

Desde 2023, los socios del ecosistema chino de AMD recibirán nuevas demandas de optimización de software de AMD casi cada dos días. Para promocionar sus GPU, los ejecutivos de AMD a veces exigen que el departamento de CPU más ventajoso iguale las GPU para realizar pedidos, con el riesgo de que las CPU no se vendan.

“La gente de AMD quema incienso y adora a Buda todos los días, con la esperanza de que podamos mejorar la ecología.”, dijo un ejecutivo de una empresa ecológica que según él, actualmenteYa hay más de 10 proveedores de nube y clientes de To B en China, en la adaptación y verificación de efectos relacionados con los chips AMD.

En comparación con los ansiosos fabricantes nacionales de chips, la ventaja de los gigantes extranjeros de chips a nivel de hardware es que tienen procesos avanzados y capacidad de producción de HBM, por lo que no existe una gran brecha entre los productos AMD e Intel y los productos Nvidia. hasta cierto punto.

Los datos oficiales muestran que el producto de AMD (MI300X lanzado en diciembre de 2023) afirmó anteriormente que la potencia informática es 1,2 veces mayor que la de Nvidia H100;

El producto de Intel (Gaudi 3 lanzado en abril de 2024) también supera con creces al H100 en eficiencia energética y rendimiento de inferencia. Por supuesto, también es más barato. El precio de la GPU de AMD es aproximadamente del 70 al 80% del de los productos de referencia de Nvidia.

Pero todos los fabricantes que son agresivos con Nvidia se enfrentan a un problema común:No importa cuán fuerte sea nuestro hardware, el software débil lo eclipsa, al igual que las deficiencias de un barril.

En una era en la que las GPU solo podían usarse para computación gráfica, la plataforma de software CUDA lanzada por NVIDIA equivalía a proporcionar a los desarrolladores un conjunto de interfaces de programación, permitiéndoles escribir libremente programas informáticos en la GPU utilizando el lenguaje de programación con el que estén más familiarizados. con.

"Déjame darte una analogía. ¿Por qué CUDA no puede superarlo? Es como si aprendieras un idioma y hubieras trabajado en este idioma durante tantos años. Si te pido que cambies un idioma, ¿te sentirás incómodo? ¿No?" ¿No estás dispuesto?" Un empleado de una empresa de chips le dio un ejemplo a 36Kr.

CUDA es la barrera más profunda para el ecosistema de software de Nvidia.Incluso Intel y AMD, que son grandes empresas, no pueden superar a otras en un corto período de tiempo.

Un ex empleado del equipo de GPU de Intel le dijo a 36Kr que habían desplegado a más de 3000 ingenieros en todo el mundo e invertido tres o cuatro años, pero solo mejoraron la precisión del 0% al 4%: usaron chips Intel para convertir un retrato y esperaron. Después de mucho tiempo, la información se perdió hasta el punto de que "ya no era un rostro humano".

Kissinger, director ejecutivo de Intel, lanza la serie de chips Gaudí

Reaparece la falacia del huevo y la gallina. Precisamente porque no mucha gente usa GPU AMD e Intel, y aún menos personas usan sus plataformas de software correspondientes (ROCm, oneAPI), es difícil para cualquiera utilizar plenamente sus verdaderas capacidades de hardware.

"CUDA de NVIDIA siempre ha tenido muchos desarrolladores iterando algoritmos, ayudando a NVIDIA a hacer que la inferencia y el entrenamiento sean muy eficientes. Como resultado, NVIDIA siempre ha tenido poder de negociación y siempre sabe qué debería hacer su próximo chip, pero este es AMD. Es un dolor de cabeza tanto para Intel como para Intel”, dijo sin rodeos el CEO de una empresa del ecosistema AMD.La herramienta de software ROCm de AMD es "igual que el CUDA de NVIDIA hace 20 años".

Pero para los clientes intermedios, aquí es donde surge el riesgo.

Verificar un modelo grande es inherentemente un experimento con incertidumbre. Si aún desea ejecutarlo en un chip que no ha sido verificado, equivale a juntar dos variables incontrolables: abandonar Nvidia significa tener que pagar una enorme cantidad de costos de migración. incertidumbre.

A pesar de esto, el cerco y la supresión de Nvidia sigue siendo una batalla que deben librar AMD e Intel.

La arquitectura global del chip se divide en tres partes: la arquitectura X86 guía el campo de las PC y está dominada por Intel y AMD, el mercado móvil está dominado por Arm y NVIDIA domina el mercado de la inteligencia artificial;

En el casi año y medio transcurrido desde que la nueva revolución de la IA marcó el comienzo de la era, Nvidia una vez cruzó la marca de valor de mercado de $ 3 billones, que ahora equivale al valor de mercado combinado de 7 Intel + AMD.

Después de 20 años, el “cerco y supresión” de Nvidia por parte de los gigantes de los chips,Fue otra batalla ansiosa y también un contraataque tardío.

verdadero crack

Cuando las empresas nacionales de chips de IA forman un ejército de hormigas, AMD e Intel hacen todo lo posible para que Nvidia se enfrente a tal asedio.

Las grietas en el imperio NVIDIA se están extendiendo silenciosamente.

Una señal a la que Nvidia debe estar atenta es que OpenAI, Google, Microsoft... estos grandes clientes que han recargado a Nvidia por su fe en la IA están dando el primer paso hacia "anti-Nvidia".

Las fichas de desarrollo propio son un juego de ajedrez que varias empresas han estado planeando durante mucho tiempo. Un ex empleado principal del equipo TPU de Google le dijo a 36Kr que Google, que utiliza 1/4 de la potencia informática del mundo,"Es posible que no compremos chips externos antes de fin de año".

En el pasado, el TPU desarrollado por Google se basaba más en consideraciones de costos. Por ejemplo, le preocupaba que Nvidia aumentara los precios a voluntad o que el suministro no fuera lo suficientemente estable. Ahora la estrategia de fabricación de núcleos de Google es más radical."Casi independientemente del costo y el costo".

OpenAI tiene innumerables preparativos. Planean recaudar hasta 7 billones de dólares estadounidenses para construir un nuevo imperio de chips de IA.

A nivel nacional, 36Kr también aprendió de muchas fuentes——En la actualidad, los mayores compradores nacionales de Nvidia, Alibaba, Byte y Baidu, básicamente están investigando en secreto chips para el entrenamiento de modelos grandes.

Progreso de productos de fabricantes extranjeros de nubes, grandes fabricantes de modelos y fabricantes de chips estrella, recopilación y mapeo completos de información de 36 Kr.

Sin embargo, los chips de desarrollo propio son, después de todo, una solución a largo plazo. Otro plan a corto plazo para estos grandes clientes es probar los productos de los competidores de Nvidia y reducir su dependencia de Nvidia.

AMD es este Plan B. Un experto de AMD le dijo a 36Kr,Los productos GPU de AMD ya han abierto grandes mercados de clientes en Europa, Estados Unidos, Corea del Sur y otros lugares——Microsoft ha comprado decenas de miles de productos AMD, y Tesla, Midjourney, el Laboratorio Nacional de EE. UU. y Korea Telecom también han recibido los productos en lotes.

En China, Chen Wen, un empleado del ecosistema AMD, dijo que en 2023 se enviarán cientos de tarjetas aceleradoras AMD de un determinado modelo. Aunque no son muchas, "este producto AMD casi nunca antes se había encontrado en China".

Según estimaciones optimistas anteriores de AMD, las GPU para centros de datos generarán hasta 2 mil millones de dólares en ingresos para AMD para fines de 2024.

Aunque el ejército de hormigas de los fabricantes chinos de chips aún no ha representado una amenaza sustancial para Nvidia, sus chispas están ganando impulso gradualmente.

36Kr se enteró de que ahora las ventas de chips nacionales de capacitación e inferencia han saltado a un nuevo nivel; una señal gratificante y positiva es que las empresas de Internet y las grandes empresas modelo, reconocidas como las más difíciles de conseguir pedidos en China, han comenzado a Invertir en chips nacionales. El fabricante abrió la boca.

Según 36Kr, actualmente,Ascend Chip ha tenido dificultades para entrar en el sistema de las empresas de Internet, incluida Baidu.

Además, las empresas nacionales de inteligencia artificial como Zhipu AI, MiniMax y Step Star están entrenando modelos grandes con billones de parámetros. Sin embargo, cuando los chips de alta gama de NVIDIA son limitados, las empresas de modelos grandes generalmente eligen el "entrenamiento mixto" (es decir, NVIDIA +). otros chips), como,El grupo de Zhipu AI reserva casi la mitad de los chips Shengteng.

Además, los productos de chips de inferencia de Tianshu Zhixin y Suiyuan han enviado decenas de miles de piezas desde el año pasado. Los canales de envío incluyen los principales centros de computación inteligentes nacionales. El primero ha ingresado a la cadena de suministro de Baichuan, un gran fabricante de modelos; Chip Kunlun Aquí, los envíos acumulados de las dos últimas generaciones de chips de inferencia son de 30.000 a 50.000 piezas, y los envíos de Baidu y canales externos representan la mitad cada uno.

"El precio actual y los niveles de oferta de Nvidia están al límite de probar si todos pueden hacerlo y cómo"., dijo sin rodeos un experto de la industria.

Fundador de NVIDIA, Huang Jenxun, fuente de imagen, Visual China

Si miramos hacia los próximos tres a cinco años, gradualmente surgirán nuevas amenazas para Nvidia.

También han aparecido en la industria nuevas arquitecturas de chips de IA distintas de las GPU; por ejemplo, la empresa de chips de Silicon Valley, Groq, que lanzó anteriormente la arquitectura LPU, afirma ejecutar grandes modelos de lenguaje "diez veces más rápido" que las GPU de Nvidia;

También está el chip Etched de Silicon Valley, que ha lanzado un chip ASIC de modelo grande, afirmando ser "un orden de magnitud más rápido" que las GPU de Nvidia. Estas nuevas empresas de chips están respaldadas por líneas de inversión estrella como OpenAI.

36Kr se enteró de que este año han surgido nuevas empresas de chips de IA en China. Por ejemplo, Shanghai recientemente apoyó en secreto a dos nuevas empresas de chips de IA.

Yang Gongyifan, director ejecutivo de Zhonghao Xinying, una empresa nacional de TPU, dijo que la tasa general de utilización de transistores de la GPU es solo del 20%. En cambio, las deficiencias son obvias, aunque las nuevas arquitecturas como TPU y ASIC no son muy versátiles. , sus transistores La tasa de utilización puede alcanzar el 60% -100% "En los próximos tres a cinco años, definitivamente habrá una gran cantidad de chips de IA fuera de la arquitectura GPU en el país y en el extranjero".

Un poquito es suficiente para sacudir al gigante NVIDIA.

"¿Crees que NVIDIA parece no tener rivales en el exterior? Realmente no es el caso", dijo un empleado de NVIDIA a 36Kr. Como suele decir Huang Renxun: "Sólo tenemos 30 días antes de la quiebra".

NVIDIA se ha estado preparando durante más de diez años y luego se topó con una empresa genial como OpenAI y juntos catalizaron el milagro de NVIDIA. En el pasado, a la industria de los semiconductores no le faltaban historias sobre adelantamientos a gigantes en las curvas.

El humo de la batalla para cercar y suprimir a Nvidia ya se ha encendido.

fin

noticias

Cerco y supresión de NVIDIA | Deep Krypton

Introducción

Mi información de contacto