noticias

El gigante de Silicon Valley hace su núcleo, el "billete" es de 2.000 millones de dólares

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"Chip Matters" es el plan de investigación de la industria de semiconductores de Tencent Technology. Este número se centra en la lógica y los desafíos de las empresas de tecnología que desarrollan chips de IA de desarrollo propio.

Autor Xinchao IC A Niu

Editor Su Yang

"Nuestras reservas de chips NVIDIA ya no pueden mantenerse al día", dijo con franqueza el director ejecutivo de una gran empresa de modelos de inteligencia artificial.

Afectados por el mayor endurecimiento de los controles de exportación, ha sido difícil comprar chips de edición especial de China, como el A800 y el H800, por lo que han sido reemplazados por la versión compatible del H20. El rendimiento de este último se ha reducido significativamente y el exterior. El mundo también lo llama versión castrada. Aun así, es posible que el H20 aún enfrente controles de exportación en la actualización de las disposiciones de control de exportaciones del Departamento de Comercio de Estados Unidos en octubre de este año.

El Financial Times citó a dos fuentes anónimas cercanas a Nvidia que dijeron que varias empresas chinas habían realizado pedidos por un total de 5 mil millones de dólares en chips a Nvidia. Al mismo tiempo, algunos chips nacionales han entrado en el campo de visión de los principales fabricantes de tecnología, pero debido a procesos, interconexión y otras razones, todavía existen brechas en el rendimiento y los desafíos de suministro.

En este contexto, muchas grandes empresas han iniciado la autoinvestigación y han desarrollado sucesivamente los chips actuales de TSMC, que cubren múltiples nodos de proceso, como 5 nm y 7 nm, para garantizar la seguridad del suministro de sus propios chips de IA.

Los controles de exportación son como un arma de doble filo, que bloquea el cuello de la potencia informática y limita el crecimiento de NVIDIA. Especialmente en el contexto de la autoinvestigación de los clientes, los ingresos de NVIDIA en China continental han comenzado a mostrar variabilidad. En el año fiscal 2022, los clientes chinos contribuyeron con el 25% de los ingresos del mercado de Nvidia, pero para el año fiscal 2024, esta proporción se redujo a un solo dígito.

Para Nvidia, el pastel en China continental se está reduciendo y Silicon Valley también está cambiando. Clientes importantes como Google, Apple, Meta, Amazon y Tesla están tratando de ir en ambos sentidos, utilizando los chips de Nvidia mientras realizan su propia investigación.

¿Cuál es la lógica detrás de los chips de desarrollo propio de los principales fabricantes chinos y estadounidenses? ¿Pueden las empresas de tecnología que están inundando el Mar Rojo aterrizar con éxito con chips de desarrollo propio?

01 La moneda fuerte sólo se siente segura cuando la tienes en la mano

En la locura actual por los modelos grandes y la IA generativa, los chips de potencia informática son la moneda fuerte en manos de las empresas de tecnología. CoreChao IC ha rastreado esta locura y tensión de "acaparar potencia informática" en el artículo "El precio altísimo del H100 fluye". al Mercado Negro".

Tener las cartas en tus propias manos es la razón fundamental por la que los grandes fabricantes desarrollan sus propios chips.

Según Chen Wei, presidente de Qianxin Technology, los principales fabricantes tienen tres bazas: suministro garantizado, reducción de costes y pujas. En términos generales, se trata de una especie de autonomía del chip.

Para muchos de los principales fabricantes chinos, especialmente los de Internet y la inteligencia artificial, se enfrentan al riesgo de sufrir cortes en el suministro de potencia informática en cualquier momento en el contexto de controles avanzados de exportación de chips. La autoinvestigación es la garantía de la seguridad de la potencia informática. Sin embargo, los chips desarrollados por cada empresa son principalmente para uso interno y las especificaciones están personalizadas para sus propios productos y no son productos de uso general.

Para los gigantes que están "quemando dinero" para acumular potencia informática, la autoinvestigación es una forma de reducir costes. "Si el volumen es lo suficientemente grande y la demanda es lo suficientemente grande, entonces considere la autoinvestigación; de lo contrario, es posible que no pueda reducir realmente los costos", dijo Wu Zihao, un ex experto en construcción de fábricas de TSMC.

En 2021, Musk lanzó la supercomputadora Dojo construida con el chip de IA D1 de desarrollo propio para entrenar a Tesla.Piloto automático sistema. Según el último informe de investigación de Morgan Stanley, este sistema ahorra un total de 6.500 millones de dólares en comparación con la A100 de Nvidia.

Con el aumento de la demanda de IA, la dependencia de Cloud Factory de la GPU supera con creces la de la CPU. La demanda de chips NVIDIA es una locura. También es un chip de oferta para que Cloud Factory obtenga pedidos de NVIDIA.

Una persona cercana a Amazon le dijo a Xinchao IC que las tarjetas NVIDIA no son baratas. Si los principales fabricantes de DSA tienen chips especiales desarrollados por ellos mismos, no solo podrán reducir por completo el costo promedio de los chips y las patentes, sino que también podrán. para competir mejor con NVIDIA. Buen poder de negociación.

La información pública muestra que Amazon no solo diseña sus propios servidores informáticos, servidores de almacenamiento y enrutadores, sino que también desarrolla su propio chip de servidor Graviton.

AWS lanza el procesador universal Graviton4

Según The Information, Amazon continúa bajando los precios al reemplazar Nvidia con Graviton. Los clientes que alquilan servidores Graviton directamente ahorran entre un 10% y un 40% en costos informáticos. Desde la perspectiva de Nvidia, si desea conservar Amazon, el cliente de fábrica de nube más grande del mundo, debe sentarse a la mesa de póquer y negociar un mejor precio.

"Este tipo de concesión de beneficios puede que a veces no se refleje plenamente en el descuento, pero sí en la asignación".

Según los expertos mencionados anteriormente, como fabricante número uno del mundo, si Nvidia ofrece directamente un descuento muy intuitivo en el precio unitario, tendrá un gran impacto negativo en el sistema de precios de los productos y no favorecerá la protección del precio de los productos. , pueden actualizar el equipo de interconexión, actualizar el almacenamiento SSD, agregar más configuraciones de rack, etc. para ofrecer descuentos a grandes clientes disfrazados.

También existe un método preferencial más común: la inclinación de la capacidad y la concesión de derechos por primera vez.

Con la ventaja de ser el primero en actuar, Amazon puede fijar el precio de la máquina completa más alto en el corto plazo y "ahorrar" (descuento) dinero de la prima de la máquina completa y la circulación de cadenas de herramientas de software de soporte.

Además de garantizar el suministro, reducir los costes y las ofertas, algunos grandes fabricantes quieren garantizar su propia competitividad desarrollando sus propios chips.

Chen Jing, vicepresidente de Fengyun Society, mencionó que los chips vendidos por NVIDIA son adecuados para la informática general y tienen funciones completas, pero también son relativamente caros. Sin embargo, algunos clientes solo necesitan funciones específicas para mejorar algunas de sus propias ventajas. , considerarán el autoestudio.

"Sólo necesito hacer inferencias de modelos grandes y no necesito funciones de entrenamiento. En este caso, puedo diseñar un chip dedicado con funciones simples, pero con una velocidad más rápida y un precio más económico", dijo Chen Jing. "Las grandes empresas como Google y Microsoft tienen sus propias especificaciones de sistemas de software y hardware. Cómo controlar el ruido y qué nivel de consumo de energía se debe alcanzar. Es posible que NVIDIA no pueda cumplir con los estándares. Será más conveniente diseñarlo usted mismo. "

Entre los gigantes de Silicon Valley, Google está muy preocupado por la diferenciación de su propia arquitectura, coste y tecnología de chip. Ha estado desarrollando su propia unidad de procesamiento de tensor (TPU) de IA desde 2016 para lograr una mejor rentabilidad en la formación a gran y mediana escala. e inferencia y desempeño para asegurar sucomputación en la nubeLos productos tienen mayor singularidad y reconocimiento.

Google lanza TPU "Trillium" de sexta generación

Según los datos relacionados con la TPU de cuarta generación revelados por Google, en comparación con sistemas del mismo tamaño, la TPU v4 es 1,7 veces más eficiente que NVIDIA A100 y 1,9 veces más ahorro de energía.

Además de los puntos anteriores, desde una perspectiva ecológica, hay una razón más profunda: romper el monopolio de CUDA. Como lenguaje de programación desarrollado por NVIDIA, CUDA es la razón principal por la que los precios de las GPU se han "elevado al cielo" y los clientes tienen que aceptarlo.

Si la fábrica de la nube no realiza una autoinvestigación, incluso si puede obtener un buen precio de pedido, más del 95% de los procesadores en el centro de datos seguirán usando GPU NVIDIA y toda la demanda de IA en la nube seguirá dependiendo de CUDA. ecosistema. En última instancia, el destino de Nvidia está en manos de Nvidia.

A medida que Cloud Factory equipe los centros de datos con chips de desarrollo propio y desarrolle muchas funciones subyacentes de traducción binaria y middleware para ayudar a los clientes a migrar a su propio ecosistema, tendrá un mayor grado de compatibilidad equivalente con los programas CUDA y su dependencia exclusiva disminuirá gradualmente.

"Esto es lo que están haciendo todas las fábricas de nube. Incluso si el procesador representa menos del 4% de todo el centro de datos, todavía tienen que insistir en hacerlo", dijo una persona familiarizada con el asunto.

02 Si hay gente y dinero, acabemos con esto

"Hay personas, dinero, cosas y, al mismo tiempo, todavía tiene potencial de futuro, por lo que se puede poner fin".

 

Yu Hao, vicepresidente de Legend Holdings, cree que la lógica de los grandes fabricantes que realizan una autoinvestigación sobre chips es relativamente sencilla: sus clientes están ahí, lo que es una clara ventaja.

"La 'gente' debe ser gente 'talentosa' con experiencia práctica en todo el ciclo de vida de los chips, y el 'dinero' debe ser 'dinero vivo' que siga aportando ingresos basados ​​en el negocio de la potencia informática. De esta manera, los principales Los fabricantes pueden confiar en el circuito cerrado del negocio de IA para hacer un balance de las perspectivas futuras. Con el crecimiento esperado del mercado, se ha cuantificado la demanda de potencia informática y se ha completado la coordinación estratégica de personas y dinero, chips de desarrollo propio. han sido algo natural”, dijo Yu Hao a Xinchao IC.

Sin embargo, la tarifa de entrada para sentarse en la mesa de póquer de desarrollo propio comienza en al menos 2 mil millones de dólares. A principios de este año,IA abierta El director ejecutivo Sam Altman incluso rumoreó sobre un loco plan para recaudar 7 billones de dólares para fabricar chips, aunque la persona involucrada luego negó el rumor.

Según una persona familiarizada con el asunto, "Cada empresa que repita sus productos de primera generación costará al menos 2 mil millones de dólares para aumentar la producción en masa si se calcula en base al nodo intermedio de 7 nanómetros".

Además, los chips de desarrollo propio son principalmente para uso propio y no necesitan considerar la dificultad de construir un ecosistema. Ran Ciyuan citó a un socio de Sky Eagle Capital diciendo: "El diseño arquitectónico de chips para fines especiales generalmente no necesita ser particularmente complicado, las características de la aplicación también son muy claras y el desarrollo es relativamente rápido. Por lo tanto, para muchos Internet Para las empresas, su desarrollo de chips de propósito especial se encuentra en un escenario claro, no es necesario gastar demasiado dinero ni tiempo para desarrollar el ecosistema de software, y el proceso de propiedad intelectual también está maduro”.

La teoría funciona, pero ¿cómo podemos hacer que el autoestudio funcione con éxito?

Según el conocimiento de la industria, la autoinvestigación de chips se puede dividir en partes de front-end y back-end. El front-end es el diseño lógico, que son las funciones más básicas del chip. El back-end es el diseño físico, que es la entidad que implementa todas las funciones en el circuito y las graba.

Diagrama esquemático del proceso de chip de desarrollo propio.

En términos generales, los únicos diseños que los equipos pequeños pueden completar de forma independiente son el front-end y el back-end del chip lógico y la propia cadena de herramientas de software, pero aun así, muchos diseños solo tienen un 5% de circuitos dedicados de desarrollo propio.

La persona antes mencionada familiarizada con el asunto dijo: “Todos en el mercado hacen 1/5 por sí mismos y piden a otros que hagan los 4/5 restantes. Este es un ecosistema bastante maduro. En cuanto a cómo obtener estas IP de circuito, algunas ya lo han hecho. canales malos, y algunos son a través de canales malos, como las licencias de fabricantes de diseño IP como ARM”.

Para muchos equipos, en realidad tienen la capacidad de diseñar algunos circuitos de forma independiente, pero debido a que necesitan superar una IP que tiene una protección de propiedad intelectual muy estricta, incluso si se fabrican, es probable que violen la arquitectura de la computadora y no se puedan usar, o Incluso infringir la propiedad intelectual de otras personas, este es también el primer obstáculo que enfrentan los fabricantes nacionales al desarrollar sus propios chips.

También hay algunas cosas que el equipo de autoinvestigación no puede diseñar, como algunas estructuras muy difíciles de NOC (Network on Chip).

El diseño es solo una parte de los chips de desarrollo propio. También incluye el montaje en cinta, la producción en masa, etc. Puede encontrar varios problemas en el proceso, como fallos en el montaje de la cinta, capacidad de producción en masa, etc., pero estos no son propios. -Al final, también necesita resolver una serie de cuestiones de apoyo, incluida cómo implementar la integración de la cadena industrial.

Desde la perspectiva del mundo exterior, un chip lógico dedicado tiene aproximadamente 500 mm² y una GPU de uso general puede tener 800 mm² y contiene decenas de miles de millones o incluso cientos de miles de millones de transistores. Algunas de sus funciones se utilizan para cálculos vectoriales y pueden ser. Se considera un procesador vectorial, pero para implementarse en escenarios de aplicación, también requiere el diseño y la implementación del almacenamiento, el control del consumo de energía, el suministro de energía y las condiciones generales de operación de la máquina. También requiere interconexión y redes para formar un grupo más grande.

Además, el objetivo final de los productos es crear diferenciación, lo que debe hacerse en la interfaz periférica y en toda la máquina, y aparecerán diferentes SKU. La industria generalmente compara el almacenamiento, el consumo de energía y la eficiencia en pies cuadrados desde la perspectiva de. toda la máquina.

En otras palabras, además de la integración de la cadena industrial y los problemas de propiedad intelectual, los chips de desarrollo propio también deben considerar los SKU del producto. No basta con diseñar un chip lógico.

Una persona de alto nivel que desea permanecer en el anonimato le dijo a Xinchao IC: “Muchas empresas nacionales no tienen capacidades de diseño de productos después de fabricar chips, tienen que ir a varios lugares para realizar pruebas. Sus ingenieros y BD comerciales están estacionados en Inspur, Sugon, etc. Todos los días, los centros de datos de los principales fabricantes esperan que la otra parte pueda dejar un zócalo en la nueva placa base del servidor para ellos mismos, si la prueba tiene éxito, comprarán un lote.

La producción en masa es otro desafío además del diseño, el montaje y la producción. ¿Los equipos pequeños deben considerar si pueden reservar capacidad de producción?

"La producción es siempre un número muy crítico para las fábricas de Fab". Wu Zihao, un ex experto en construcción de fábricas de TSMC, dijo que los fabricantes deben comprender en qué vínculo entran y cuánta producción prometen. Este es el punto más crítico para impresionar a Fab.

Los fabricantes de primer nivel básicamente han reservado la última capacidad de producción de las fábricas Fab durante la etapa DTCO (Optimización colaborativa de tecnología de diseño). Actualmente, los mejores equipos de diseño del mundo, como ARM, tienen una gran cantidad de personas estacionadas en TSMC cada año, incluido. muchos fabricantes de EDA.

DTC determina los indicadores de rendimiento de los procesadores de próxima generación en nodos específicos, como cuánto dinero se puede ahorrar y cuánto se puede mejorar el rendimiento mediante un diseño de diseño razonable en el nodo de 3 nm.

"NVIDIA y Apple siempre están dispuestos a probar los procesos de fabricación más avanzados. Siempre que TSMC presente un proceso de fabricación de vanguardia, incluso si se desconoce el rendimiento y la ganancia de rendimiento, es decir, antes de que el modelo económico pueda "El diseño colaborativo de DTCO con las fábricas Fab es la razón fundamental para que los fabricantes de primer nivel obtengan capacidad de producción", dijo Wu Zihao.

Si no hay un diseño colaborativo desde el principio, la fábrica Fab y el equipo de Fabless, Partido A y Partido B, tendrán que intercambiar roles. Porque nadie se atreve a usarlo, la fábrica Fab solo puede promover su nuevo proceso poco a poco. , comenzando con el proceso de menor riesgo.

Por ejemplo, los chips de las máquinas mineras tienen una estructura muy simple y un tamaño muy pequeño, por lo que son muy adecuados para las pruebas iniciales. El primer cliente del chip de 3 nm de Samsung fue una fábrica de equipos de minería de China.

Wu Zihao dijo: "Después de que la fábrica Fab pruebe con éxito el agua con pedidos de clientes tan pequeños, podrá intentar producir en masa CPU de PC, chips de teléfonos móviles y, finalmente, chips de IA, paso a paso".

En la actualidad, los principales fabricantes nacionales han invertido al menos miles de millones de dólares en chips de desarrollo propio. Si una empresa nueva quiere entrar en el juego, debe tener suficientes clientes iniciales o una plataforma de aplicaciones que admita la adaptación de chips y la prueba y error, o debe tener suficiente capital o una sólida capacidad de financiación. deben cumplirse.

Chen Wei le dijo a Xinchao IC que si es una empresa comercial sin reservas de mano de obra de bajo costo y no depende de escuelas o institutos de investigación, necesitará una financiación de no menos de 500 millones a 1.000 millones de RMB antes de la producción en masa; es un instituto de investigación o un instituto de investigación. Con otro apoyo, los costos laborales se pueden reducir mucho y el umbral monetario puede ser ligeramente más bajo.

"Si no tiene tanto dinero, pero esta startup tiene capacidades de control de costos muy sólidas, puede aprovechar al máximo la colaboración ascendente y descendente para reducir costos. Todo es para garantizar la continuación de la investigación y el desarrollo de productos".

En términos de prioridad de selección de Fab, según personas familiarizadas con el asunto, las startups inicialmente optarán por ordenar la capacidad de producción de TSMC, seguida de GlobalFoundries, pero GlobalFoundries no tiene procesos ni empaques avanzados, y luego recurrirán a SMIC, pero SMIC All La capacidad de producción que se puede reservar a nivel internacional está prevista para el año que viene.

Ante esta situación, las instituciones de inversión adoptan una perspectiva de más largo plazo.

Yu Hao dijo que solo para los chips de alta gama de desarrollo propio nacional, es inevitable enfrentar cuellos de botella en el corto plazo. El largo plazo depende de la velocidad de evolución del pulido de la línea de proceso avanzado y la expansión de la capacidad representada por SMIC. depende principalmente de la circulación interna. Sin embargo, es posible que los fabricantes con capacidades de diseño de chips de alta gama deseen considerar la posibilidad de viajar al extranjero y utilizar la circulación externa para impulsar la circulación interna. Salir abrirá un futuro mejor.

03 No es fácil ser el “sepulturero” de Nvidia

Los antiguos clientes crean sus propios negocios y Nvidia siempre es la que sale perjudicada.

Esta ola global de autoinvestigación está explotando más que la anterior. Además de resultados de autoinvestigación maduros como Google TPU y Amazon Graviton. Recientemente, todo el círculo tecnológico se ha visto afectado por "Sohu, el primer chip de IA del mundo dedicado a Transformer".

La startup de chips estadounidense Etched lanza el chip de inteligencia artificial Sohu específico para transformadores

Este chip incorpora directamente la arquitectura Transformer en el chip y su rendimiento de razonamiento supera con creces el de las GPU y otros chips de inteligencia artificial generales. Se afirma que es 10 veces más potente que el B200, un chip de primer nivel que se lanzó recientemente. Marzo de este año. Se rumorea que un servidor equipado con 8 chips Sohu tiene un rendimiento comparable al de un grupo de 160 GPU H100 y puede procesar hasta 500.000 tokens Llama 7B por segundo.

Había nacido el "popular pollo frito" y la fábrica Fab y sus socios estaban contentos.

Se informa que la empresa ha cooperado directamente con el proceso de 4 nm de TSMC para la producción de chips Sohu y ha obtenido suficientes suministros de servidores y HBM de los principales proveedores. Algunos de los primeros clientes ya han reservado decenas de millones de dólares en hardware de la empresa. Los internautas le pusieron a Etched un apodo: "El sepulturero de Nvidia".

Pero, ¿se hará añicos el mito de la “autoinvestigación” de NVIDIA debido al humo que se eleva? en realidad no.

En la industria de los semiconductores, existe un famoso "ciclo del Sr. Ben": los tipos de chips evolucionan regularmente entre la generalización y la personalización; en un período determinado, la estructura general se vende mejor y es popular entre los usuarios, pero después de alcanzar una determinada etapa. , las estructuras de propósito general se quedan atrás en la respuesta a necesidades específicas, y las estructuras de propósito especial se volverán populares.

Y NVIDIA representa legítimamente la era de la arquitectura universal, que se encuentra todavía en su apogeo.

Según las estadísticas de Wells Fargo, NVIDIA posee actualmente el 98% del mercado mundial de aceleración de IA para centros de datos y se encuentra en una posición absolutamente dominante. Esto significa que el 98% de la población mundial está utilizando CUDA C de NVIDIA para "exprimir" el rendimiento de todas las GPU, y sólo el 2%-3% restante de la gente todavía insiste en usar un "martillo" malo para martillar lo mismo. "clavo".

"Ahora, ya sea Amazon o Intel, los procesadores que ellos mismos fabrican no pueden satisfacer económicamente la maximización de los intereses de un proveedor de nube, por lo que definitivamente continuarán usando chips NVIDIA en grandes cantidades hasta que un día NVIDIA pierda por completo su ventaja. En el camino de especialización de la ganadería, afirmó la persona familiarizada con el asunto.

Sin embargo, acostarse no está en consonancia con la personalidad de NVIDIA. Huang Renxun es una persona que sabe "nacer en el dolor y morir en la felicidad". En su discurso en la Universidad Nacional de Taiwán hace un año, dijo: "Si se trata de correr por comida". , o no Cuando otros te utilizan como alimento, a menudo no tienes idea de en qué situación te encuentras, pero sigues corriendo sin importar qué ".

Esta vez, ante el desafío de la autoinvestigación en todo Silicon Valley, Nvidia también juega sus cartas.

El alto directivo antes mencionado le dijo a Xinchao IC: “Nvidia ya no es una GPU de uso general. En su unidad de GPU, se puede ver una gran cantidad de Tensor Cores para resolver cálculos matriciales. Además, también se pueden ver motores Transformer, dispersos. motores, etc., ya sea en términos de estructura de hardware o actualizaciones de operadores de hardware, NVIDIA se está impulsando hacia la tendencia de diseño basada en DSA cada año”.

DSA (Arquitectura específica de dominio) es una arquitectura de procesador programable personalizada para campos específicos, que puede optimizar el rendimiento y la rentabilidad de aplicaciones específicas. Actualmente, Google, Tesla, OpenAI y Cerebras han lanzado sus propios chips DSA para aplicaciones específicas.

Según personas familiarizadas con el asunto, todos los fabricantes de DSA encontrarán que incluso si Nvidia no modifica el hardware y las GPU de uso general solo actualizan un operador, las ventajas de los fabricantes de DSA se perderán por completo. Parece que en comparación con NVIDIA, no solo el área del chip lógico no es lo suficientemente grande, sino que la capacidad y la velocidad del dispositivo no son lo suficientemente grandes, la potencia informática no es tan buena como la de NVIDIA y la adaptabilidad del software no es lo suficientemente buena. Lo que enfrentan todos los fabricantes de DSA El problema: el ciclo Muben originalmente iba a avanzar hacia la arquitectura y personalización específicas del dominio DSA, pero ahora ha regresado a la era de los procesadores de uso general.

Además de "mirarse en el espejo" con los fabricantes de DSA, Nvidia también ha extendido su rama de olivo a la autoinvestigación. A principios de 2024, creó un nuevo departamento de negocios, dirigido por la veterana en semiconductores Dina McKinney, específicamente para la computación en la nube y las telecomunicaciones 5G. y juegos. Construimos chips personalizados para clientes en el sector del automóvil y otros campos.

Reuters citó a personas familiarizadas con el asunto diciendo que los ejecutivos de Nvidia se han reunido con representantes de Amazon, Meta, Microsoft, Google y OpenAI para discutir chips personalizados para ellos. Además de chips para centros de datos, la compañía también busca obtener telecomunicaciones y automoción. y Cliente de videojuegos.

Anteriormente, se informó que es probable que la nueva versión de la consola de juegos Nintendo Switch lanzada por Nintendo este año esté equipada con chips personalizados de NVIDIA. NVIDIA también tiene una profunda presencia en el mercado de dispositivos portátiles y ha lanzado una serie de chips móviles Tegra. Aunque esta serie de chips finalmente no ocupó un lugar en el mercado de dispositivos móviles.

En un mercado dominado por la rentabilidad, no es tan fácil ser el sepulturero de Nvidia. La mayoría de los sepultureros anteriores fracasaron: es posible que finalmente sean adquiridos. Por ejemplo, Intel y Google adquirieron muchas empresas emergentes, pero la mayoría de las otras empresas ni siquiera esperaron a la adquisición y murieron directamente.

Quizás sea más fácil para las empresas emergentes tener éxito si cambian su perspectiva.

"Por ejemplo, no se obsesione con el procesador de IA en sí. En lugar de dedicar mucho tiempo a cumplir el ideal de un DSA, es mejor considerar soluciones a nivel de sistema. Por ejemplo, se pueden fabricar periféricos para proporcionar servicios para el procesador de IA y almacenamiento profesional, los sensores profesionales también pueden lograr el mismo propósito", dijo una persona familiarizada con el asunto.

En 2019, Nvidia anunció que adquiriría Mellanox por 6.900 millones de dólares. Esta valoración fue tan alta que Nvidia casi sobregiró todo su flujo de caja.

Esta empresa no desarrolla puertos ni módulos fotovoltaicos, ni tampoco conmutadores. Sólo fabrica un producto: el PHY "InfiniBand" para la interconexión de alta velocidad entre la capa inferior del conmutador y la capa inferior de comunicación. Para Nvidia, que estaba ansiosa por superar las limitaciones de la interconexión de servidores en ese momento, este era un requisito periférico muy básico. No importa qué tan bueno fuera NVLink en ese momento, siempre estuvo bloqueado en una sola máquina. Pero InfiniBand puede permitir que los conmutadores superen el cuello de botella de interconexión entre servidores e interconecten todas las GPU en un clúster grande.

En cuanto a la situación actual, la situación nacional está en auge y las balas de los chips de desarrollo propio tendrán que volar por un tiempo. Chen Wei cree que crear un juego no es algo malo, pero es necesario crear un juego de alta gama para evitar perder el período crítico para el desarrollo industrial.

Zhou Jiangong, fundador de Unfinished Research, amplió aún más esta visión. Cree que las aplicaciones futuras requerirán chips de IA profesionales, personalizados y miniaturizados que superarán la demanda de modelos grandes básicos de vanguardia. Entrenar código abierto, modelos más pequeños a menor costo o ajustar y destilar modelos grandes, así como la inferencia, brindan un amplio espacio para los chips de desarrollo propio. Además, en los rápidos cambios y la etapa inmadura de las nuevas tecnologías, habrá una gran cantidad de oportunidades de autoinvestigación en torno a las aplicaciones mencionadas.

"No hagas cosas que acaben con Nvidia, sino haz más cosas además de Nvidia".