notícias

A NVIDIA entrou em um momento conturbado, por que ainda estamos otimistas?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texto | Shidao, autor | Shidao AI Group, editora |

A NVIDIA teve problemas recentemente e isso é um grande problema.

A primeira é a “agressão estrangeira”. Devido aos constantes “pequenos movimentos”, a empresa enfrenta uma investigação antitruste do Departamento de Justiça dos EUA.

A segunda são "preocupações internas". Devido a erros de design do produto, o prazo de envio do novo chip Blackwell será atrasado em três meses.

Na semana passada, o preço das ações da Nvidia entrou em uma montanha-russa - na terça-feira, caiu 7% na quarta-feira, subiu quase 13% na quinta-feira, fechou em queda de quase 7% na sexta-feira;Mesmo olhando para a volatilidade, a Nvidia superou o Bitcoin.A volatilidade implícita de sua opção de 30 dias subiu recentemente de 48% para 71%, enquanto o índice Bitcoin DVOL caiu de 68% para 49%.

O conhecido fundo de hedge Elliott disse aos investidores: a Nvidia está em uma “bolha” e a tecnologia de IA tem sido superestimada. A agência disse que os maiores clientes da Nvidia estão desenvolvendo seus próprios chips e duvida que os gigantes continuarão a comprar GPUs da Nvidia em grandes quantidades. Quando a bolha vai estourar? Elliott acredita que se os resultados financeiros da Nvidia forem ruins, poderá ocorrer uma ruptura.

É inegável que a Nvidia está entrando em um “momento conturbado”, mas ainda é muito cedo para ser “combatido por todos os lados”.

A supervisão visa especificamente as “sete polegadas” da NVIDIA, sendo estável, mas não implacável

No início de julho, a França disparou o primeiro tiro antitruste contra a NVIDIA. Nas semanas seguintes, a Nvidia também foi alvo do Departamento de Justiça dos EUA.

A informação informou que investigadores do Departamento de Justiça dos EUA visitaram as casas dos “oponentes” e “clientes” da Nvidia para recolher as acusações de todos.

Alegação 1: NVIDIA ameaça clientes.Quando você compra chips AMD, a Nvidia pode aumentar o preço para você ou até mesmo reduzir as remessas de GPU originalmente prometidas.

Alegação 2: A Nvidia forçou a distribuição de cabos e racks de rede.Os grandes sofredores incluem: Microsoft, Google, Amazon...

Certa vez, para obter direitos de envio prioritários, a Microsoft cerrou os dentes e comprou os cabos de rede da Nvidia. Quando as contas foram acertadas no início de 2023, descobriu-se que 1/3 do dinheiro pago à Nvidia foi gasto nesses produtos “de ponta”. . É relatado que as vendas de cabos de rede da Nvidia mais que triplicaram, para US$ 3,2 bilhões, representando 14% de sua receita total de data center.

Hoje, o vice-presidente da Nvidia, Andrew Bell, também disse: “Quem comprar a prateleira terá prioridade na obtenção do GB200”.
A Microsoft escapou do desastre após semanas de “disputas”, enquanto a Amazon e o Google concordaram devido à sua coerção;

Alegação três: Nvidia adquire Run:ai.A transação foi anunciada oficialmente no final de abril deste ano, e o preço de compra foi de US$ 700 milhões.

Run:ai é uma startup israelense focada em simplificar aplicativos de IA e cargas de trabalho em GPUs, tornando assim os chips de IA mais eficientes, o que por sua vez ajuda a reduzir o número de GPUs Nvidia necessárias para concluir tarefas.

A integração da funcionalidade Run:ai da Nvidia em produtos existentes não apenas "mata" a possibilidade de seu uso por oponentes,Também aumentou seu alcance DGX e DGX Cloud.

Lao Huang Zaoyun é “um ‘bom retiro’ para a NVIDIA evitar se tornar Cisco”. Uma delas é que as empresas de nuvem e software geram bilhões de dólares anualmente. A segunda é que a Nvidia tem “todas as alavancas” para desenvolver serviços complementares aos seus chips.

Quer se trate da "alocação estrita de GPUs" mencionada acima, "engajamento na distribuição de bens e compra e venda forçada" e "construção de uma nuvem e de um ecossistema", todos esses são os "movimentos difíceis" de Huang Renxun para consolidar o império NVIDIA em o longo prazo. Afinal, seu objetivo é que todas as empresas do mundo... rodem com Nvidia AI Enterprise.

Portanto, esta investigação do Departamento de Justiça dos EUA pode ser descrita como “estável e precisa” e atingiu as “sete polegadas” da Nvidia.

Mas quanto a “ser implacável ou não” é outra questão. Afinal, as investigações antitruste muitas vezes duram anos e o governo pode não apresentar acusações contra a empresa-alvo. Mesmo que o litígio seja iniciado, o caso pode arrastar-se durante anos antes de ser concluído.

Por exemplo, o caso antitruste de pesquisa do Google de 2020 só foi a julgamento este ano, e o juiz responsável pelo caso ainda não tomou uma decisão.

Resumindo, embora esta investigação antitruste ocorra de forma feroz e rápida, parece que não pode prejudicar os alicerces do império da GPU.

Dois impactos diretos são esperados na Nvidia.

Primeiro, afeta aquisições futuras. Por exemplo, em 2021, a FTC entrou com uma ação judicial por motivos antitruste para impedir a Nvidia de gastar US$ 40 bilhões para adquirir a Arm do SoftBank. Olhando agora, Masayoshi Son pode voltar à vida graças à FTC.

A segunda é reprimir o “acordo overlord”. Afinal, ele foi alvo e os “pequenos movimentos” da Nvidia podem ser contidos.

Nvidia treme e desenvolvimento global de IA desacelera

Vamos falar sobre as “preocupações internas” dos produtos da Nvidia.

Segundo relatos,Devido a defeitos de design, os modelos B100 e B200 da NVIDIA foram cancelados. Os pedidos anteriores foram entregues com 20% da quantidade do pedido e posteriormente atualizados para B200A. As entregas estão previstas para começar em meados do próximo ano.

No entanto, o progresso do GB200 não foi adiado neste momento. O "rei mais forte" GB200 não é apenas um chip, mas uma plataforma poderosa que combina dois chips B200. (1 GB200 tem 1 CPU Grace + 2 B200).

É relatado que a demanda do mercado por B100 em si não é grande e os clientes mudaram de B100 para B200 (demanda por mais de 450.000 unidades).

A julgar pelo feedback de algumas instituições, a solução atual é usar o H200 para preencher primeiro a lacuna.A Nvidia lançará o H200 principalmente no terceiro trimestre e adicionará alguns H200 aos clientes em outubro e novembro, e tudo estará normal em dezembro, o mais tardar.

Este atraso irá perturbar os planos de implementação de grandes clientes como Meta, Google e Microsoft, e pode afectar o progresso do desenvolvimento de produtos e serviços que dependem dos chips de IA da Nvidia, incluindo IA generativa, processamento de vídeo e outras aplicações de IA.

Em outras palavras, mesmo que os analistas gritem “bolha NVIDIA”, assim que algo acontecer com a NVIDIA, o processo global de desenvolvimento de IA ficará mais lento.

Ou seja, se você quiser provar que a bolha da NVIDIA está prestes a estourar, ou provar que a bolha da IA ​​está prestes a estourar ou provar que a demanda do mercado por GPUs está desacelerando ou provar que a NVIDIA está competindo; os produtos estão começando a brilhar.

Mas neste momento não se pode dar provas de um acerto.

Por que você está otimista com a Nvidia

Primeiro, a bolha da IA ​​​​está prestes a estourar? Não.

Como o chefe mais “pessimista”, o “Professor Dalong” Daron Acemoglu, o deus das principais publicações internacionais, acredita que nos próximos 10 anos, a IA aumentará a produtividade em cerca de 0,53% a 0,66% e aumentará o PIB em cerca de 0,9%.

Jim Covello, chefe global de pesquisa de ações da Goldman Sachs, também é bastante pessimista: a IA deve ser capaz de resolver problemas complexos antes que as suas receitas excedam as suas despesas, que são cerca de 1 bilião de dólares.Quanto à bolha de IA, a visão de Covello é que ela pode demorar para estourar.

Ao mesmo tempo, o Morgan Stanley e o “TMT King” Coatue de Wall Street estão muito optimistas quanto às perspectivas da IA.

O Morgan Stanley acredita que o actual boom de investimento em infra-estruturas de IA está na sua fase inicial e ainda não atingiu o nível da bolha da Internet em 1999. O investimento em GPU, em particular, apenas começou.

Coatue acredita que a IA não é um exagero e que a era de ouro ainda não chegou. A IA não é uma bolha de avaliação, mas é principalmente um jogo para gigantes;

Além disso, a GPU já está cheia? Não.

Aqui está a batalha entre Sequoia e a16z.

A Sequoia "falou mal" das GPUs, acreditando que o pico de escassez de oferta havia passado, e calculou que a lacuna de receita da indústria de IA devido à compra de GPUs atingiu US$ 500 bilhões.

a16z, por outro lado, não apenas gastou centenas de milhões de dólares para estocar milhares de GPUs, mas também lançou o "Projeto Oxygen" de maneira de alto perfil, planejando, em última análise, expandir o tamanho do cluster de GPU para mais mais de 20.000 unidades.

Como isso é prático? Que tal mudarmos nosso pensamento.

O pensamento convencional - o modelo é poderoso e aparecem aplicativos matadores - quanto maior a demanda por poder de computação - maior a demanda por GPU.

Mas por outro lado, se fizermos uma analogia entre a era da IA ​​e a era da Internet. Pode-se concluir que a Internet é uma rede de computadores, e o modelo de IA é um computador conectado à rede. Assim como todo mundo tem um PC e um smartphone, uma variedade de modelos de IA aparecerão na era da IA, e todos eles formarão um ecossistema completo.

Portanto, a era da IA ​​requer mais poder computacional. Mas agora o custo do poder computacional é demasiado elevado e escasso, o que afecta ainda mais o progresso do desenvolvimento da IA. Isso pode ser visto no tremor da NVIDIA e na desaceleração do desenvolvimento global de IA.

Além disso, mesmo que não olhemos para o longo prazo, olhamos apenas para o curto prazo. Do treinamento à inferência, há uma demanda enorme e não atendida por poder computacional.

Citando os cálculos do Neocórtex x CBN. De acordo com as estatísticas da Omdia, no final de 2023, as remessas totais da Nvidia H100 atingiram 1,2 milhão. Nos quatro trimestres até o final de abril de 2024, a Nvidia ganhou US$ 65,8 bilhões com vendas de chips de IA. Com base no preço de cada H100 de US$ 40.000, a NVIDIA vendeu aproximadamente 1,645 milhão de H100s nos últimos quatro trimestres. Aproximadamente equivalente ao mercado geral de treinamento de modelos (ou seja, assumindo que 100 modelos de linguagem grande de nível GPT-3.5, 50 de nível GPT-4, 10 modelos de linguagem grande de nível GPT-5 e 10 modelos de geração de imagens de nível Midjourney foram treinados globalmente, e 1/ 4 de 20 modelos de geração de vídeo no nível Sora).

Esta é apenas a demanda do mercado por treinamento de modelos. A inferência é um mercado muito maior e ainda não foi realmente aberto. Se calcularmos conservadoramente que cada pessoa gera apenas um vídeo por mês, a demanda global de poder computacional para inferência de modelos grandes é equivalente a 10,4 milhões de chips H100, o que é o dobro do treinamento de modelos. E se a tecnologia e o mercado de geração de vídeo se tornarem mais maduros, o consumo de energia computacional necessário para inferência aumentará para dezenas ou até centenas de vezes o consumo de treinamento.

O CEO do Google, Pichai, disse: “O risco de subinvestimento é muito maior do que o risco de superinvestimento”.

Como disse o CEO da Meta, Zuckerberg: “Prefiro investir demais do que economizar dinheiro desacelerando o desenvolvimento”.

A Microsoft afirma que a capacidade atual do poder de computação da IA ​​limita o seu rendimento financeiro, e esta situação continuará até pelo menos o primeiro trimestre do ano fiscal de 2025. Musk até desenvolveu seu próprio supercomputador para desafiar a Nvidia.

Finalmente, o fosso da Nvidia é forte? sim.

Em relação ao futuro da NVIDIA, Coatue expressou diretamente suas opiniões:Se houver uma bolha, não será uma bolha de valorização, mas uma bolha onde os lucros são impulsionados.

Então, quem pode desafiar a Nvidia?

Por um lado, em comparação com as três principais acusações mencionadas acima, a Nvidia tem uma acusação maior – agrupamento de software e hardware.

Hoje, mais de 95% dos processadores em data centers usam GPUs NVIDIA. Toda a demanda de IA na nuvem ainda depende do ecossistema CUDA, e o CUDA só pode ser usado com chips NVIDIA. Os programadores não querem aprender outra linguagem, e CUDA é até considerado o fosso da NVIDIA.

Para derrubar a "tirania" da Nvidia, Google, Meta e Microsoft atualmente querem unir forças para participar do projeto de linguagem de código aberto Triton lançado pela OpenAI, Intel, AMD e Qualcomm também querem usar Triton para roubar clientes da Nvidia;

Embora o Triton possa enfraquecer a participação de mercado da Nvidia, os analistas do Citi estimam que a participação da Nvidia no mercado de chips generativos de IA ainda será de cerca de 63% até 2030, o que significa que manterá seu domínio por muitos anos.

Por outro lado, os gigantes lançaram desafios um após o outro, e a Nvidia também está em constante execução. Afinal, Huang Renxun certamente terá em mente os “problemas causados ​​​​pela arrogância” de seu antecessor Cisco.

De acordo com o "ciclo Makimoto" de semicondutores - os tipos de chips alternam regularmente entre uso geral e customizado - estruturas de uso geral são mais populares durante um determinado período, mas depois de atingir um determinado estágio, estruturas especializadas que atendem a necessidades específicas surgirão diretamente. .

Atualmente, a era das estruturas universais representadas pela NVIDIA está em processo de subversão.

Além do mais, no início deste ano, a Nvidia estabeleceu uma nova unidade de negócios para construir chips personalizados para clientes de computação em nuvem, telecomunicações 5G, jogos, automóveis e outras áreas. Há notícias de que o novo Nintendo Switch lançado este ano provavelmente será equipado com chips personalizados da Nvidia.

Mas a Nvidia é absolutamente sólida? Pensei em uma frase: "O processo está certo, mas o resultado está errado." Para usar uma analogia inadequada, se o forte poder de barganha da Nvidia fizer com que o custo do poder de computação da IA ​​permaneça alto por um longo tempo, inibindo assim a grande escala. inovação, também pode haver reação negativa.