noticias

NVIDIA ha entrado en un momento convulso, ¿por qué seguimos siendo optimistas?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texto | Shidao, autor | Shidao AI Group, editora |

NVIDIA ha tenido problemas recientemente y es un gran problema.

El primero es la "agresión extranjera". Debido a los constantes "pequeños movimientos", la empresa se enfrenta a una investigación antimonopolio por parte del Departamento de Justicia de Estados Unidos.

El segundo son las "preocupaciones internas". Debido a errores de diseño del producto, el tiempo de envío del nuevo chip Blackwell se retrasará tres meses.

La semana pasada, el precio de las acciones de Nvidia se subió a una montaña rusa: el martes cayó un 7% el miércoles, se disparó casi un 13% el jueves, cerró con una caída de casi un 7% el viernes;Incluso considerando la volatilidad, Nvidia ha superado a Bitcoin.Su opción de 30 días implicó que la volatilidad aumentó recientemente del 48% al 71%, mientras que el índice Bitcoin DVOL cayó del 68% al 49%.

El conocido fondo de cobertura Elliott dijo a los inversores: Nvidia está en una "burbuja" y la tecnología de inteligencia artificial ha sido sobrevalorada. La agencia dijo que los clientes más importantes de Nvidia están desarrollando sus propios chips y duda que los gigantes sigan comprando GPU de Nvidia en grandes cantidades. ¿Cuándo estallará la burbuja? Elliott cree que si los resultados financieros de Nvidia son malos, puede producirse una ruptura.

Es innegable que Nvidia está entrando en una "época convulsa", pero aún es demasiado pronto para verse "atacada por todos lados".

La supervisión se centra específicamente en las “siete pulgadas” de NVIDIA, siendo constante pero no despiadada

A principios de julio, Francia disparó el primer tiro antimonopolio contra NVIDIA. En las semanas siguientes, Nvidia también fue atacada por el Departamento de Justicia de Estados Unidos.

The Information informó que investigadores del Departamento de Justicia de Estados Unidos visitaron las casas de los “oponentes” y “clientes” de Nvidia para recopilar las acusaciones de todos.

Alegación 1: NVIDIA amenaza a los clientes.Cuando compra chips AMD, Nvidia puede aumentar el precio o incluso reducir los envíos de GPU prometidos originalmente.

Alegación 2: Nvidia forzó la distribución de racks y cables de red.Los grandes afectados incluyen: Microsoft, Google, Amazon...

Una vez, para obtener derechos de envío prioritarios, Microsoft apretó los dientes y compró los cables de red de Nvidia. Cuando se liquidaron las cuentas a principios de 2023, se descubrió que 1/3 del dinero pagado a Nvidia se gastó en estos productos "de vanguardia". . Se informa que las ventas de cables de red de Nvidia se han más que triplicado hasta alcanzar los 3.200 millones de dólares, lo que representa el 14% de los ingresos totales de sus centros de datos.

Hoy, el vicepresidente de Nvidia, Andrew Bell, también dijo: "Quien compre el estante tendrá prioridad para conseguir GB200".
Microsoft escapó del desastre después de semanas de "disputas", mientras que Amazon y Google llegaron a un acuerdo debido a su coerción.

Tercera acusación: Nvidia adquiere Run:ai.La transacción se anunció oficialmente a finales de abril de este año y el precio de compra fue de 700 millones de dólares.

Run:ai es una startup israelí centrada en simplificar las aplicaciones de IA y las cargas de trabajo en las GPU, haciendo así que los chips de IA sean más eficientes, lo que a su vez ayuda a reducir la cantidad de GPU Nvidia necesarias para completar las tareas.

La integración por parte de Nvidia de la funcionalidad Run:ai en productos existentes no sólo "mata" la posibilidad de que sus oponentes la utilicen,También ha aumentado su alcance en DGX y DGX Cloud.

Lao Huang Zaoyun es "un 'buen retiro' para que NVIDIA evite convertirse en Cisco". Una es que las empresas de software y nube generan miles de millones de dólares al año. La segunda es que Nvidia tiene "todas las palancas" para desarrollar servicios complementarios a sus chips.

Ya sea la "asignación estricta de GPU" mencionada anteriormente, "participar en la distribución de bienes y la compra y venta forzada" y "construir una nube y un ecosistema", todos estos son los "movimientos difíciles" de Huang Renxun para consolidar el imperio NVIDIA en el largo plazo. Después de todo, su objetivo es que todas las empresas del mundo... funcionen con Nvidia AI Enterprise.

Por tanto, esta investigación del Departamento de Justicia de Estados Unidos puede describirse como "estable y precisa" y alcanza las "siete pulgadas" de Nvidia.

Pero en cuanto a "ser despiadado o no" es otra cuestión. Después de todo, las investigaciones antimonopolio suelen durar años y, en última instancia, es posible que el gobierno no presente cargos contra la empresa objetivo. Incluso si se inicia un litigio, el caso puede prolongarse durante años antes de concluir.

Por ejemplo, el caso antimonopolio de búsqueda de Google de 2020 llegó a juicio este año y el juez responsable del caso aún no se ha pronunciado.

En resumen, aunque esta investigación antimonopolio se produce de forma feroz y rápida, parece que no puede dañar los cimientos del imperio GPU.

Se esperan dos impactos directos en Nvidia.

En primer lugar, afecta a futuras adquisiciones. Por ejemplo, en 2021, la FTC presentó una demanda por motivos antimonopolio para evitar que Nvidia gastara 40.000 millones de dólares para adquirir Arm de SoftBank. Mirándolo ahora, Masayoshi Son puede volver a la vida gracias a la FTC.

El segundo es tomar medidas enérgicas contra el "acuerdo de señor supremo". Después de todo, ha sido un objetivo y los "pequeños movimientos" de Nvidia pueden verse restringidos.

Nvidia tiembla y el desarrollo global de la IA se ralentiza

Hablemos de las "preocupaciones internas" de los productos de Nvidia.

Según los informes,Debido a defectos de diseño, los modelos B100 y B200 de NVIDIA fueron cancelados. Los pedidos anteriores se entregaron al 20% de la cantidad del pedido y luego se actualizaron a B200A. Se espera que las entregas comiencen a mediados del próximo año.

Sin embargo, el avance del GB200 no se ha retrasado por el momento. El "rey más fuerte" GB200 no es solo un chip, sino una poderosa plataforma que combina dos chips B200. (1 GB200 tiene 1 CPU Grace + 2 B200).

Se informa que la demanda del mercado del B100 en sí no es grande y los clientes han pasado del B100 al B200 (demanda de más de 450.000 unidades).

A juzgar por los comentarios de algunas instituciones, la solución actual es utilizar H200 para llenar el vacío primero.Nvidia lanzará H200 principalmente en el tercer trimestre y agregará algunos H200 a los clientes en octubre y noviembre, y todo será normal a más tardar en diciembre.

Este retraso interrumpirá los planes de implementación de clientes importantes como Meta, Google y Microsoft, y puede afectar el progreso del desarrollo de productos y servicios que dependen de los chips de inteligencia artificial de Nvidia, incluida la inteligencia artificial generativa, el procesamiento de video y otras aplicaciones de inteligencia artificial.

En otras palabras, incluso si los analistas gritan "burbuja de NVIDIA", una vez que algo le suceda a NVIDIA, el proceso global de desarrollo de la IA se ralentizará.

Es decir, si quiere demostrar que la burbuja de NVIDIA está a punto de estallar, o que la burbuja de la IA está a punto de estallar, o que la demanda del mercado de GPU se está desacelerando o que NVIDIA está compitiendo; Los productos están empezando a brillar.

Pero por el momento no se puede dar prueba de un acierto.

Por qué eres optimista con Nvidia

En primer lugar, ¿está a punto de estallar la burbuja de la IA? No.

Como el jefe más "pesimista", el "profesor Dalong" Daron Acemoglu, el dios de las principales publicaciones internacionales, cree que en los próximos 10 años, la IA aumentará la productividad entre un 0,53% y un 0,66% y aumentará el PIB en aproximadamente un 0,9%.

Jim Covello, jefe global de investigación de acciones de Goldman Sachs, también es bastante pesimista: la IA debe ser capaz de resolver problemas complejos antes de que sus ingresos superen sus gastos, que rondan el billón de dólares.En cuanto a la burbuja de la IA, la opinión de Covello es que puede tardar mucho en estallar.

Al mismo tiempo, Morgan Stanley y el “Rey TMT” Coatue de Wall Street son muy optimistas sobre las perspectivas de la IA.

Morgan Stanley cree que el actual auge de la inversión en infraestructura de IA se encuentra en sus primeras etapas y aún no ha alcanzado el nivel de burbuja de Internet de 1999. La inversión en GPU, en particular, acaba de comenzar.

Coatue cree que la IA no es una exageración y que la edad de oro aún no ha llegado; la IA no es una burbuja de valoración, sino principalmente un juego de gigantes.

En segundo lugar, ¿la GPU ya está llena? No.

Aquí está la batalla entre Sequoia y a16z.

Sequoia "habló mal" de las GPU, creyendo que el pico de escasez de suministro había pasado, y calculó que la brecha de ingresos de la industria de la IA debido a la compra de GPU alcanzó los 500 mil millones de dólares.

A16z, por otro lado, no solo gastó cientos de millones de dólares para abastecerse de miles de GPU, sino que también lanzó el "Proyecto Oxígeno" de manera destacada, y en última instancia planeó expandir el tamaño del clúster de GPU a más. más de 20.000 unidades.

¿Cómo es práctico? ¿Qué tal si cambiamos nuestra forma de pensar?

El pensamiento convencional: el modelo es potente y aparecen aplicaciones asesinas: cuanto mayor es la demanda de potencia informática, mayor es la demanda de GPU.

Pero por otro lado, si hacemos una analogía entre la era de la IA y la era de Internet. Se puede concluir que Internet es una red de computadoras y el modelo de IA es una computadora conectada a la red. Así como todo el mundo tiene una PC y un teléfono inteligente, en la era de la IA aparecerán una variedad de modelos de IA, y todos ellos formarán un ecosistema completo.

Por lo tanto, la era de la IA requiere más potencia informática. Pero ahora el costo de la potencia informática es demasiado alto y escaso, lo que afecta aún más el progreso del desarrollo de la IA. Esto se puede ver en el temblor de NVIDIA y la desaceleración del desarrollo global de la IA.

Además, aunque no miremos el largo plazo, sólo miramos el corto plazo. Desde la formación hasta la inferencia, existe una demanda enorme e insatisfecha de potencia informática.

Citando los cálculos de Neocortex x CBN. Según las estadísticas de Omdia, a finales de 2023, los envíos totales de Nvidia H100 alcanzaron los 1,2 millones. En los cuatro trimestres hasta finales de abril de 2024, Nvidia ganó 65.800 millones de dólares mediante la venta de chips de IA. Teniendo en cuenta que el precio de cada H100 es de 40.000 dólares, NVIDIA ha vendido aproximadamente 1,645 millones de H100 en los últimos cuatro trimestres. Aproximadamente equivalente al mercado de capacitación de modelos en general (es decir, suponiendo que se hayan capacitado globalmente 100 modelos de lenguaje grande de nivel GPT-3.5, 50 de nivel GPT-4, 10 de nivel GPT-5 y 10 modelos de generación de imágenes de nivel Midjourney, y 1/ 4 de 20 modelos de generación de vídeo de nivel Sora).

Esta es solo la demanda del mercado de capacitación modelo. La inferencia es un mercado que es mucho más grande y aún no se ha abierto realmente. Si calculamos de manera conservadora que cada persona solo genera un video por mes, la demanda global de potencia informática para la inferencia de modelos grandes equivale a 10,4 millones de chips H100, que es el doble que el entrenamiento de modelos. Y si la tecnología y el mercado de generación de vídeo maduran, el consumo de potencia informática necesaria para la inferencia se disparará hasta decenas o incluso cientos de veces el de las necesidades de formación.

Pichai, director ejecutivo de Google, dijo: "El riesgo de una inversión insuficiente es mucho mayor que el riesgo de una inversión excesiva".

Como dijo el CEO de Meta, Zuckerberg: "Prefiero invertir en exceso que ahorrar dinero frenando el desarrollo".

Microsoft afirma que la capacidad actual de potencia informática de la IA limita sus ingresos financieros, y esta situación continuará al menos hasta el primer trimestre del año fiscal 2025. Musk incluso desarrolló su propia supercomputadora para desafiar a Nvidia.

Finalmente, ¿es fuerte el foso de Nvidia? Sí.

Respecto al futuro de NVIDIA, Coatue expresó directamente su opinión:Si hay una burbuja, no es una burbuja de valoración, sino una burbuja en la que se impulsan los beneficios.

Entonces, ¿quién puede desafiar a Nvidia?

Por un lado, en comparación con las tres acusaciones principales mencionadas anteriormente, Nvidia tiene una acusación mayor: la agrupación de software y hardware.

Hoy en día, más del 95% de los procesadores de los centros de datos utilizan GPU NVIDIA. Toda la demanda de IA en la nube todavía depende del ecosistema CUDA, y CUDA solo se puede utilizar con chips NVIDIA. Los programadores no quieren aprender otro idioma y CUDA incluso se considera el foso de NVIDIA.

Para derrocar la "tiranía" de Nvidia, Google, Meta y Microsoft actualmente quieren unir fuerzas para participar en el proyecto de lenguaje de código abierto Triton lanzado por OpenAI. Intel, AMD y Qualcomm también quieren utilizar Triton para cazar clientes de Nvidia.

Aunque Triton puede debilitar la participación de mercado de Nvidia, los analistas de Citi estiman que la participación de Nvidia en el mercado de chips de IA generativa seguirá siendo de alrededor del 63% para 2030, lo que significa que mantendrá su dominio durante muchos años.

Por otro lado, los gigantes han lanzado desafíos uno tras otro y Nvidia también está en constante funcionamiento. Después de todo, Huang Renxun definitivamente tendrá en cuenta los "problemas causados ​​por la arrogancia" de su predecesor Cisco.

Según el "ciclo Makimoto" de semiconductores (los tipos de chips se alternan regularmente entre los de uso general y los personalizados), las estructuras de propósito general son las más populares durante un cierto período, pero después de alcanzar una determinada etapa, surgirán estructuras especializadas que satisfagan necesidades específicas de Chase. .

En la actualidad, la era de las estructuras universales representada por NVIDIA está en proceso de subversión.

Es más, a principios de este año, Nvidia estableció una nueva unidad de negocios para construir chips personalizados para clientes en computación en la nube, telecomunicaciones 5G, juegos, automóviles y otros campos. Hay noticias de que es probable que el nuevo Nintendo Switch lanzado este año esté equipado con chips personalizados de Nvidia.

¿Pero es Nvidia absolutamente sólida como una roca? Pensé en una frase: "El proceso es correcto, pero el resultado es incorrecto". Para usar una analogía inapropiada, si el fuerte poder de negociación de Nvidia hace que el costo de la potencia informática de la IA se mantenga alto durante mucho tiempo, inhibiendo así las operaciones a gran escala. innovación, también puede haber reacciones negativas.