notícias

Não podendo pagar a “oferta especial” da Nvidia, os empresários chineses preferem 4090

2024-08-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Já se passou um ano e meio desde que as vendas do A100 e do H100 foram proibidas, mas agora está cada vez mais difícil para a Nvidia vender versões castradas para a China.

Recentemente, analistas da Jeffries disseram que os Estados Unidos realizarão uma revisão anual dos controles de exportação de semicondutores em outubro, e é “provável” proibir as vendas da Nvidia H20 para a China. eExistem três métodos possíveis de banimento: banir produtos específicos, reduzir o limite superior do poder de computação e limitar a capacidade de memória.

NVIDIA planeja lançar um novo chip AI de edição especial para a China. Esta notícia não parou desde que Huang Renxun anunciou oficialmente a Blackwell em março. A principal notícia atual é queA Nvidia planeja lançar o B20, uma “versão castrada” do B200.

Mas muitos pequenos e médios empresários na China compreendem:Independentemente do preço ou da dificuldade de aquisição, o mais recente chip de IA de ponta da Nvidia provavelmente será “encontrado na nuvem” por si só.

O empresário de IA Jason disse à Alphabet (ID: wujicaijing) que a direção anterior de sua empresa era a camada de aplicação de IA. Além de alugar o poder de computação do A100 e H100 por meio de serviços em nuvem, ela implantou 50 chips NVIDIA V100 localmente, bem como NVIDIA. Placa gráfica 3090.

Essa escolha não ocorre apenas porque as start-ups desejam buscar a relação custo-benefício e reduzir custos, mas também porque fazer negócios na camada de aplicação de IA não exige, na verdade, um poder computacional extremamente alto. V100 é uma placa de computação lançada pela NVIDIA em 2017. Naquela época, o preço oficial do servidor de oito placas V100 era de 1,02 milhão de yuans. Os 50 V100s de Jason eram produtos de segunda mão "comprados por 900 yuans cada", e as 3.090 placas gráficas foram coletadas por 5.000 yuans cada.

A partir do final de 2022, os chips mais poderosos da Nvidia foram impedidos de serem exportados para a China devido à atualização dos controles de exportação de semicondutores dos Estados Unidos. Nem o A100 nem o H100 mais poderoso da Blackwell podem ser vendidos oficialmente na China. Depois disso, os controles de exportação dos Estados Unidos para chips de última geração tornaram-se cada vez mais rígidos. A Nvidia lançou um chip "China Special Edition" após o outro, de A800 e H800 a H20, L20 e L2.

Para a maioria dos empresários, não só o desempenho da versão especial é muito inferior ao da “versão original”, mas o preço também é proibitivo. Um vendedor disse à Alphabet que o preço do servidor de oito placas H20 é de cerca de 1,3 milhão de yuans. O IT Times relatou certa vez que os principais demandantes do H20 são grandes empresas de Internet, como Baidu, Alibaba, Tencent e Byte.

Jason disse que H20 é usado principalmente para raciocínio, mas "é melhor usar 4090 do que H20".Como este último é suficiente e o H20 é um chip comercial, "o uso comercial tem uma taxa de depreciação e o desconto é relativamente grande. A sala de informática será substituída a cada poucos anos e o valor geralmente não é mantido. Por exemplo, o O V100 era vendido por dezenas de milhares naquela época, mas agora só pode ser vendido por alguns milhares, ou seja, em cinco ou seis anos, se não fosse pelo boom da IA, valeria no máximo 500.”

Mais de um membro da indústria disse à Alphabet que prefere usar Nvidia RTX4090. Este principal produto lançado em outubro de 2022 foi originalmente nomeado como uma placa gráfica para jogos, mas também é favorecido pela indústria de IA e também pelos chips dos EUA. exportações. O impacto da regulação.

Zhejiang Huaxi Cloud Technology Co., Ltd., fornecedora de supercomputação de IA, também disse que “o mais comumente usado atualmente é o 4090”, mas “na verdade, também depende da configuração, rede e placa gráfica”. as necessidades de muitos clientes podem ser atendidas pelo 4090, e a relação preço/desempenho também é melhor. O funcionário acrescentou ainda que a empresa vai instalar 100.4090 unidades este mês.

Sobre a notícia de que a NVIDIA lançará um novo produto especial na China, a “versão castrada” B20 do B200, Jason não está animado e disse “depende do desempenho de custo”, enquanto Hua Xiyun disse que não ouviu nenhuma notícia relevante na indústria.

A Reuters havia relatado anteriormente que a Nvidia havia cooperado com o B20 nas informações sobre as ondas chinesas, mas este último respondeu que a notícia não era verdadeira.

UM

Em 19 de março deste ano, Jen-Hsun Huang subiu ao palco do SAP Center em San Jose, Califórnia, EUA, e fez um discurso intitulado "Testemunhando o momento transformacional da IA".

Lao Huang raramente se gaba. A Nvidia anunciou oficialmente uma nova geração da arquitetura Blackwell e lançou o chip B200 e o super chip GB200. “Nova bomba nuclear” é como o mundo exterior descreve os novos produtos da NVIDIA. Jim Fan, que na época acabava de ser promovido a gerente de pesquisa da NVIDIA, lamentou que a Lei de Moore não pudesse mais reprimir a empresa.

Mas uma exploração experimental da Apple bloqueou ligeiramente o progresso da Nvidia. Huang Renxun pode ter se tornado a pessoa no mundo que menos espera pelo lançamento dos smartphones da Apple.

Em 30 de julho, horário de Pequim, a Apple publicou um artigo técnico que continha esta informação: Os dois modelos de IA que suportam a inteligência da Apple são pré-treinados nos chips de nuvem do Google.

Primeiro, o chip desenvolvido pelo próprio Google é um processador tensor TPU, que anteriormente era usado principalmente internamente pelo Google e não vendido externamente. Desta vez, ele agiu para roubar um grande cliente. Em segundo lugar, a Apple foi anteriormente revelada pelo Wall Street Journal em maio que estava desenvolvendo chips de desenvolvimento próprio para seus servidores de data center. Agora, ela não usou chips de desenvolvimento próprio, mas ainda não escolheu a Nvidia. Isso é suficiente para envergonhar a Nvidia.

O “passeio” da Apple pela Nvidia é um microcosmo da situação atual da Nvidia. O preço das ações da Nvidia subiu 150% nos primeiros seis meses deste ano, mas despencou em julho, sendo responsável por quatro das oito maiores quedas no valor de mercado.

Além disso, a Nvidia tem recebido constantes más notícias recentemente: há rumores de que a entrega de seu novo chip B200 será adiada por três meses ou mais, o Departamento de Justiça dos EUA lançou duas investigações antitruste contra ela;

Em contraste, há notícias constantes da “edição especial da China” – de acordo com vários relatos da mídia estrangeira, a Nvidia planeja lançar o B20, uma versão castrada do B200, na China. Além disso, a Nvidia também pode vender servidores equipados com os chips mais recentes para a China, usando servidores para compensar o desempenho de chips especialmente fornecidos. Se a notícia for verdadeira, esta será a primeira vez que a Nvidia lança um produto de servidor específico para o mercado chinês.

As medidas acima mencionadas mostram também que apesar de enfrentar muitos obstáculos, a Nvidia não só não desistiu, como também fez maiores esforços pelo mercado chinês.

Fim de 2022Bate-papoGPTA onda de IA já dura quase dois anos e a Nvidia deixou de ser uma gigante de chips para se tornar uma das empresas com maior valor de mercado do mundo. Hoje em dia, o caminho da IA ​​​​está gradualmente retornando à racionalidade e os concorrentes estão lentamente formando uma tendência de cerco e supressão. A China se tornou um mercado cada vez mais difícil de ser abandonado pela Nvidia.

B

Para um grande número de start-ups de pequeno e médio porte no caminho da IA ​​​​na China, os chips de edição especial da NVIDIA na China não são o foco. ePara as grandes empresas de Internet da China, principais compradoras de chips de edição especial, escolher a NVIDIA é apenas a melhor solução no momento.

A Nvidia lançou o HGX H20, L20 PCle e L2 PCle customizado para a China em outubro de 2023. O H20 é o tão aguardado “general entre os anões” e o modelo mais forte na versão castrada. Porém, um mês depois, com a notícia de que a NVIDIA havia adiado a entrega do H20 para o primeiro trimestre do ano seguinte, muitas empresas recorreram aos chips nacionais.

Naquela época, o China Fund News informou que o Baidu havia encomendado 1.600 chips Ascend 910B da Huawei para 200 servidores. Zhou Hongyi também declarou na Cúpula de Wuzhen, não muito tempo atrás, que a 360 comprou mais de 1.000 chips de IA da Huawei, antes do Baidu.

No primeiro semestre deste ano, houve notícias de que as vendas da Nvidia H20 na China foram fracas devido à atitude de esperar para ver das empresas e à concorrência de fabricantes nacionais como a Huawei. Em maio, houve notícias de que o preço do H20 foi reduzido. As razões apontadas para dois pontos Um foi que o H100 não estava fora de estoque e começou a reduzir os preços, e o H20 foi posteriormente reduzido. com ele, e o preço inicial deste último era maior.

No segundo semestre do ano, as vendas do H20 na China parecem estar a mudar. Não muito tempo atrás, a empresa de consultoria da indústria de chips SemiAnalysis previu que os chips H20 deverão impulsionar o desempenho da empresa na China durante o atual ano fiscal, com mais de 1 milhão de chips H20 previstos para serem entregues este ano. Com base no preço de venda de um único chip de US$ 12.000 a US$ 13.000, o H20 sozinho pode contribuir com mais de US$ 12 bilhões em receitas para a NVIDIA, o que excede a receita geral da NVIDIA na China no último ano fiscal. Um relatório do IT Times apontou que o aumento nas vendas do H20 se deve principalmente às vantagens ecológicas da Nvidia e à oferta restrita do Ascend 910B da Huawei.

Para a Nvidia, isso só pode ser considerado uma felicidade de curto prazo. A recuperação alcançada devido às vantagens ecológicas e à oferta restrita dos concorrentes não pode ser considerada estável. A próxima geração de chips “China Special Edition” provavelmente está a caminho, mas a Nvidia enfrenta muitos desafios.

Além da suposta versão “castrada” do B200, o B20, segundo o The Information, a Nvidia também planeja fornecer um chip especial para a nova versão da China para combinar com o servidor. A Nvidia lançou um servidor especificamente na China, uma ação que a NVIDIA nunca fez antes. Essa mudança visa maximizar o desempenho dos chips especialmente fornecidos no servidor e compensar as deficiências da “versão castrada”.

Se a notícia sobre o uso de servidores como solução de “pacote” for verdadeira, será uma nova tentativa da Nvidia sob as restrições do banimento.

A má notícia é que o mercado mais uma vez informou que a entrega do último chip da Nvidia foi adiada. De acordo com um relatório recente da The Information, a Nvidia disse aos clientes que o lançamento do B200 será adiado por três meses ou mais, e as remessas em massa podem ser adiadas para o primeiro trimestre do próximo ano (a produção em volume foi originalmente planejada para começar em outubro deste ano).

Entre os "clientes" mencionados aqui estão muitos gigantes da tecnologia. É relatado que a Meta fez pedidos no valor de pelo menos US$ 10 bilhões. A Microsoft também aumentou o tamanho dos seus pedidos em 20% nas últimas semanas e planeja expandir seus pedidos no primeiro trimestre. do próximo ano.IA abertaPrepare 55.000 a 65.000 GB200.

Há razões para suspeitar que o atraso na entrega do B200 também afetará o ritmo da Nvidia de lançar uma versão castrada no mercado chinês. O relatório afirmou que o motivo do atraso na entrega foi uma “falha de projeto” descoberta durante a produção.

C

Embora a Nvidia ainda não tenha confirmado o lançamento do B20, poucos duvidam que isso acontecerá.

Em comparação com 2022, quando a Nvidia foi pela primeira vez sujeita a uma proibição de exportação de chips de IA, agora é ainda mais difícil para a gigante dos chips deixar o mercado chinês.

A enorme demanda de chips da China é naturalmente a principal força motriz.No ano fiscal de 2022 e no ano fiscal de 2023, a China Continental e Hong Kong contribuíram com 7,111 mil milhões de dólares e 5,785 mil milhões de dólares em receitas para a Nvidia, respetivamente, representando 31,7% e 25,9% da sua receita total, respetivamente.

No entanto, a Nvidia corre o risco de estagnar na China devido à proibição de chips nos EUA. No ano fiscal de 2024, a receita da Nvidia no mercado chinês, incluindo o continente, Hong Kong e Macau, parou em 10 mil milhões de dólares americanos, e a sua quota caiu para 16,9%.

Em maio deste ano, a NVIDIA divulgou seu relatório de desempenho para o primeiro trimestre do ano fiscal de 2025 (em 28 de abril de 2024). No negócio de data center, a receita da NVIDIA proveniente de clientes chineses diminuiu de 19% no ano fiscal de 2023. Em meados de 2023. porcentagem de um dígito (5%) até o ano fiscal de 2024.

Em relação à concorrência iniciada pelos fabricantes locais de chips da China, Huang Renxun também está bem ciente: "Nossos negócios na China realmente diminuíram muito em comparação com o nível anterior. Devido a limitações técnicas, a concorrência na China é agora mais intensa. Todos estes são fatos ." Dias depois, Huang Renxun mencionou novamente as empresas chinesas de chips, dizendo que a China tem muitas start-ups de GPU e não deveria subestimar a capacidade da China de se atualizar no campo de chips.

De uma certa perspectiva, embora a proibição de vendas de chips nos EUA tenha tornado mais difícil para as empresas chinesas de IA sobreviverem a esta onda, ela também oferece espaço para desenvolvimento para os fabricantes locais de chips da China. Do ponto de vista de Huang Renxun, isso é sem dúvida perigoso,O tempo está passando e não resta muito tempo para a Nvidia romper a “castração”.

Esses não são todos os fatores que tornam a NVIDIA mais relutante em deixar o mercado chinês. Em comparação com o final de 2022, quando o ChatGPT lançou uma guerra de mil modelos e as vendas e o preço das ações da NVIDIA dispararam, a NVIDIA enfrenta agora uma situação cada vez mais incerta.

Somente neste ano, foi revelado que as ambições de rede de 7 trilhões de chips do CEO da OpenAI, Sam Altman, foram reveladas. A Microsoft está desenvolvendo uma substituição semelhante à placa de rede ConnectX-7 da Nvidia, na esperança de melhorar o desempenho de seu chip Maia, desenvolvido por ela mesma. Groq, uma empresa de tecnologia fundada pelo criador do Google TPU, Jonathan Ross, afirma que seus novos produtos podem ameaçar a Nvidia.

A entrada da Apple nos braços do Google é mais um passo em frente no pesadelo da Nvidia: além dos chips de desenvolvimento próprio, uma gigante da tecnologia com fortes recursos financeiros juntou-se à batalha da IA, mas não escolheu a Nvidia.

Além da concorrência, a Nvidia também enfrenta uma pressão regulatória crescente. Primeiro, em julho, a Autoridade da Concorrência Francesa confirmou que estava investigando as suspeitas de violações da concorrência de mercado por parte da Nvidia. Então, em agosto, o Departamento de Justiça dos EUA lançou duas investigações antitruste contra a Nvidia.

O preço das ações da Nvidia subiu 150% nos primeiros seis meses deste ano. No entanto, o Federal Reserve ficou para trás no corte das taxas de juros e Wall Street também exerceu forte pressão sobre as ações de tecnologia. Sob a influência de vários fatores, o preço das ações da Nvidia "finalmente". " despencaram uma após a outra em julho, representando a maior queda no valor de mercado. Quatro em oito vezes.

Neste caso, a Nvidia precisa e deve manter a sua influência no mercado chinês.Embora esta onda de IA seja emocionante, o caminho à frente ainda está cheio de neblina. Ninguém pode dizer se a Nvidia atingirá o teto ou mesmo cairá no altar em resposta à “maldição” da “teoria da bolha de IA”.

Exatamente quatro anos atrás, em agosto de 2020, a Nvidia anunciou seu relatório financeiro do segundo trimestre para o ano fiscal de 2021, e a receita trimestral do data center excedeu o negócio de jogos pela primeira vez. Hoje, os data centers substituíram os jogos como principal negócio da NVIDIA. Mas Huang Renxun vem se preparando para esta etapa há muitos anos.

A NVIDIA de hoje também precisa planejar o futuro, não apenas para manter a confiança, mas também para “manter a mão”. Um dado interessante é que, de acordo com o relatório financeiro do primeiro trimestre da NVIDIA para o ano fiscal de 2025, o negócio automotivo foi responsável por apenas 1,2% da receita total naquele trimestre, mas foi o único negócio da NVIDIA que alcançou crescimento trimestral fora dos dados. negócio central. Entre os parceiros de negócios automotivos anunciados oficialmente pela Nvidia, as montadoras chinesas e os fornecedores de soluções de direção inteligente representam mais de 80%.

Desta perspectiva, a importância do fornecimento especial de chips de IA da China pode não ser apenas sobre IA, mas também que a Nvidia precisa ter uma influência sustentada na China que possa servir de fulcro para o futuro, mesmo que enfrente o destino de ser castrado de novo e de novo.

Referências:

Laboratório de Pesquisa de Silício: "A participação na receita da China continental despenca, a proibição de chips nos EUA" apunhala "a Nvidia"

CyberCar: "Graças às montadoras chinesas, a Nvidia se recuperou."

TMTpost Media: “Por trás da “montanha-russa” do preço das ações da NVIDIA, o status do gigante dos chips de IA não é inabalável”

IT Times: “Por que a Nvidia H20 com desempenho “castrado” é tão popular? 》

Observação da indústria de semicondutores: “3 trilhões de empresas de chips também estão tentando sobreviver nas fendas?” 》