notícias

O lançamento do novo chip AI da Nvidia será adiado por pelo menos 3 meses e gigantes como Microsoft, Google e Meta serão afetados.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Destaques:

Tencent Technology News, 3 de agosto: De acordo com relatos da mídia estrangeira, o mais recente projeto de chip de inteligência artificial da Nvidia encontrou uma falha de design. De acordo com duas fontes envolvidas na produção de chips e hardware de servidor, este acidente fará com que o tempo de lançamento seja atrasado em pelo menos três. meses meses, ou até mais.

Espera-se que a mudança tenha impacto em vários clientes importantes, incluindo Meta, Google e Microsoft, que encomendaram dezenas de bilhões de dólares da série de chips.

A NVIDIA notificou a Microsoft, um de seus maiores clientes e outro grande provedor de serviços em nuvem esta semana, que a entrega de seus chips de inteligência artificial mais avançados da série Blackwell será adiada, de acordo com funcionários internos da Microsoft e outra pessoa familiarizada com o assunto. .

A Nvidia lançou oficialmente a série Blackwell em março deste ano, e o CEO Huang Jenxun anunciou com otimismo em maio que planejava realizar remessas em grande escala desta série de chips ainda este ano. No entanto, o processo sofreu um revés após encontrar dificuldades de projeto. De acordo com pessoas diretamente envolvidas na produção de chips Blackwell, a Nvidia está trabalhando com seu fabricante de chips TSMC para conduzir uma nova rodada de produção de testes intensivamente para superar os atuais obstáculos técnicos.

Diante disso, espera-se que os embarques em grande escala de chips Blackwell sejam adiados para o primeiro trimestre do próximo ano. É importante notar que, assim que os provedores de serviços em nuvem receberem os chips, serão necessários cerca de três meses adicionais para implantar e ativar grandes clusters de chips.

Os desafios de design e produção aumentaram as preocupações sobre a situação da Nvidia, especialmente enquanto o Departamento de Justiça dos EUA investiga reclamações de alegado comportamento anticompetitivo. Apesar disso, a Nvidia ainda mantém sua posição de liderança na indústria devido às significativas vantagens de desempenho de seus chips.

Os acionistas têm grandes esperanças na série Blackwell, e os analistas da Keybanc Capital Markets prevêem que a série de chips deverá fazer com que a receita do data center da Nvidia salte de US$ 47,5 bilhões em 2024 para mais de US$ 200 bilhões em 2025. Huang Jen-Hsun disse durante a teleconferência de resultados em maio: "Veremos a Blackwell trazer receitas substanciais este ano!"

O chip de servidor de inteligência artificial da Nvidia, a unidade de processamento gráfico (GPU), tem sido a principal força motriz para desenvolvedores como a OpenAI no campo da inteligência artificial de conversação e vídeo. Ao mesmo tempo, essas GPUs ajudam gigantes de serviços em nuvem, como a Microsoft, a alcançar um crescimento significativo nas vendas, alugando recursos de chips para outros desenvolvedores.

Se os próximos chips de inteligência artificial B100, B200 e GB200 encontrarem atrasos de pelo menos três meses, isso poderá atrapalhar os planos de implantação de alguns clientes, fazendo com que eles não consigam executar grandes clusters de chips em data centers conforme programado no primeiro trimestre de 2025 .

Clientes de peso como Microsoft, OpenAI e Meta aguardam ansiosamente os novos chips da Nvidia, com o objetivo de usar essas tecnologias para atualizar e desenvolver a próxima geração de grandes modelos de linguagem, que é o software central por trás do ChatGPT, assistente Meta AI e uma série de automação inovadora funções.

Essas empresas enfatizam a necessidade de mais poder computacional para alcançar saltos quânticos no desempenho do software para responder com mais precisão a consultas complexas, automatizar tarefas de várias etapas ou gerar conteúdo de vídeo altamente realista. Eles têm grandes esperanças nos chips de inteligência artificial de próxima geração da Nvidia, especialmente nos saltos de desempenho que podem trazer quando integrados em clusters de supercomputadores.

Um porta-voz da Nvidia foi cauteloso com declarações relacionadas a atrasos nas remessas, dizendo apenas que “o progresso da produção será acelerado conforme planejado” ainda este ano.

Representantes oficiais da Microsoft, Google, Amazon e Meta optaram por não comentar. Um porta-voz da TSMC não respondeu a um pedido de comentário.

É importante notar que os principais clientes da Nvidia têm grandes esperanças no chip GB200 e têm planos ambiciosos. Recentemente, Google, Meta e Microsoft revelaram o seu enorme crescimento de investimento em centros de dados e chips de inteligência artificial. Este movimento raro não só elevou temporariamente o preço das ações da Nvidia, mas também gerou preocupações no mercado sobre o ciclo de retorno do investimento e as perspectivas de lucro destas empresas. Discutido extensivamente.

Grande pedido da Blackwell

De acordo com duas fontes na área de produção de chips, o Google encomendou mais de 400.000 chips GB200. Juntamente com o hardware de servidor relacionado, o preço total do pedido pode ser bem superior a 10 bilhões de dólares americanos, mas o prazo de entrega específico ainda não está claro. Em contraste, o investimento do Google em chips, equipamentos e ativos este ano subiu para aproximadamente 50 mil milhões de dólares, um aumento anual de mais de 50%.

Ao mesmo tempo, a Meta também está fazendo grandes movimentos, com pedidos totais estimados em nada menos que US$ 10 bilhões. A Microsoft, embora não tenha divulgado o tamanho total dos pedidos, fez ajustes incrementais de 20% nos pedidos nas últimas semanas. De acordo com pessoas com conhecimento direto, a Microsoft está se preparando para equipar a OpenAI com 55.000 a 65.000 chips GB200 até o primeiro trimestre de 2025.

Uma pessoa familiarizada com o assunto disse que a Microsoft planejou originalmente entregar servidores baseados em Blackwell para OpenAI até janeiro do próximo ano, mas agora pode precisar ser ajustado para março ou início da primavera.

Dois especialistas envolvidos no processo de fabricação do chip Blackwell disseram que surgiram dificuldades de design com o chip nas últimas semanas, e os engenheiros da TSMC descobriram falhas importantes no estágio de preparação para produção em massa. Especificamente, o problema está centrado no chip do processador que conecta as GPUs duplas da Blackwell. A falha deste componente de silício afeta diretamente a produção geral, o que significa que o número de chips que a TSMC pode fornecer à Nvidia é limitado. Tais problemas muitas vezes levam as empresas a suspender as atividades de produção.

Diante disso, a NVIDIA está ajustando urgentemente o plano de design e precisa executar novamente os testes de produção na TSMC para garantir que o problema seja resolvido antes de iniciar o processo de produção em massa.

Segundo pessoas familiarizadas com o assunto, a Nvidia revelou a pelo menos um provedor de serviços em nuvem que, para lidar com as dificuldades atuais e agilizar a entrega de produtos, a empresa está considerando lançar uma versão equipada com apenas um único chip Blackwell como alternativa. .

atraso incomum

A TSMC planejou originalmente lançar a produção em massa de chips Blackwell no terceiro trimestre e esperava iniciar remessas em massa para clientes da Nvidia no quarto trimestre. No entanto, espera-se agora que a produção em massa de chips Blackwell seja adiada até o quarto trimestre. Se não houver novos problemas no futuro, os servidores serão enviados em grandes quantidades nos trimestres seguintes.

Atrasos na produção de chips não são incomuns. De acordo com pessoas familiarizadas com o assunto, a Nvidia também encontrou atrasos nas primeiras versões de sua GPU carro-chefe em 2020, mas sua influência no mercado ainda era baixa na época e as expectativas dos clientes em relação aos pedidos não eram altas. e a renda do investimento em chips era limitada.

No entanto, é incomum que uma grande falha de projeto seja descoberta pouco antes da produção em massa. Em circunstâncias normais, a equipe de design de chips trabalhará em estreita colaboração com fabricantes como a TSMC e passará por várias rodadas de testes e simulações de produção para garantir que o produto esteja maduro e confiável antes de aceitar pedidos de grande volume.

De acordo com funcionários internos da TSMC, como fabricante líder mundial de chips, a TSMC raramente suspendeu sua linha de produção para redesenhar este produto que está prestes a ser produzido em massa. Tendo em vista o plano de produção em larga escala dos chips GB200, a TSMC alocou recursos de produção pré-alocados, mas esses recursos permanecerão ociosos até que o problema seja resolvido.

Além disso, a falha de design também afetou o cronograma de produção e entrega dos racks de servidores NVLink da Nvidia, porque as empresas relevantes precisam esperar por novas amostras de chips para concluir o design do rack. (Compilado/Cervo Dourado)