notícias

Gigante do Vale do Silício faz núcleo, “ingresso” custa US$ 2 bilhões

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"Chip Matters" é o plano de pesquisa da indústria de semicondutores da Tencent Technology. Esta edição enfoca a lógica e os desafios das empresas de tecnologia que desenvolvem chips de IA autodesenvolvidos.

Autor Xinchao IC A Niu

Editor Su Yang

“Nossas reservas de chips NVIDIA não conseguem mais acompanhar.” Disse francamente um CEO de uma grande empresa de modelos de IA.

Afetados pelo maior rigor nos controles de exportação, tem sido difícil comprar chips de edição especial da China, como A800 e H800. Em vez disso, eles foram substituídos pela versão compatível do H20. O desempenho deste último diminuiu significativamente. mundo também a chama de versão castrada. Mesmo assim, o H20 ainda poderá enfrentar controles de exportação na atualização das disposições de controle de exportação do Departamento de Comércio dos EUA em outubro deste ano.

O Financial Times citou duas fontes anônimas próximas à Nvidia dizendo que várias empresas chinesas fizeram pedidos de um total de US$ 5 bilhões em chips da Nvidia. Ao mesmo tempo, alguns chips nacionais entraram no campo de visão dos principais fabricantes de tecnologia, mas devido ao processo, à interconexão e a outras razões, ainda existem lacunas no desempenho e nos desafios de fornecimento.

Neste contexto, muitas grandes empresas iniciaram a autopesquisa e desenvolveram sucessivamente os chips atuais da TSMC, cobrindo vários nós de processo, como 5nm e 7nm, para garantir a segurança do fornecimento de seus próprios chips de IA.

Os controles de exportação são como uma faca de dois gumes, bloqueando o poder da computação e limitando o crescimento da NVIDIA. Especialmente no contexto da autopesquisa dos clientes, a receita da NVIDIA na China continental começou a mostrar variabilidade. No ano fiscal de 2022, os clientes chineses contribuíram com 25% da receita de mercado da Nvidia, mas no ano fiscal de 2024, esta proporção caiu para um dígito.

Para a Nvidia, o bolo na China continental está a diminuir e o Vale do Silício também está a mudar. Grandes clientes como Google, Apple, Meta, Amazon e Tesla estão todos tentando seguir os dois caminhos, usando chips da Nvidia enquanto fazem suas próprias pesquisas.

Qual é a lógica por trás dos chips autodesenvolvidos pelos principais fabricantes chineses e americanos. As empresas de tecnologia que estão inundando o Mar Vermelho conseguirão pousar com sucesso com chips autodesenvolvidos?

01 A moeda forte só parece segura quando você a segura na mão

Na atual mania de grandes modelos e IA generativa, os chips de poder de computação são a moeda forte nas mãos das empresas de tecnologia. CoreChao IC rastreou essa loucura e tensão de "agarrar o poder da computação" no artigo "The Sky-High Price H100 Flows". para o Mercado Negro".

Ter as cartas nas mãos é a razão fundamental pela qual os principais fabricantes desenvolvem seus próprios chips.

Segundo Chen Wei, presidente da Qianxin Technology, os grandes fabricantes têm três trunfos: fornecimento garantido, redução de custos e licitação. De modo geral, é uma espécie de autonomia do chip.

Para muitos grandes fabricantes chineses, especialmente os de Internet e inteligência artificial, eles enfrentam o risco de cortes no fornecimento de energia computacional a qualquer momento, no contexto de controles avançados de exportação de chips. A autopesquisa é a garantia da segurança da energia computacional. Porém, os chips desenvolvidos por cada empresa são principalmente para uso interno, e as especificações são customizadas para seus próprios produtos e não são produtos de uso geral.

Para os gigantes que estão “queimando dinheiro” para acumular poder computacional, a autopesquisa é uma forma de reduzir custos. “Se o volume for grande o suficiente e a demanda for grande o suficiente, então considere a autopesquisa, caso contrário, pode não ser possível reduzir realmente os custos”, disse Wu Zihao, ex-especialista em construção de fábricas da TSMC.

Em 2021, Musk lançou o supercomputador Dojo construído com o chip AI autodesenvolvido D1 para treinar TeslaPiloto automático sistema. De acordo com o último relatório de pesquisa do Morgan Stanley, este sistema economiza um total de US$ 6,5 bilhões em comparação com o A100 da Nvidia.

Com o aumento da demanda por IA, a dependência da Cloud Factory da GPU excede em muito a da CPU. A demanda por chips NVIDIA é uma loucura. A autopesquisa também é um chip de licitação para a Cloud Factory obter pedidos da NVIDIA.

Uma pessoa próxima à Amazon disse ao Xinchao IC que as placas NVIDIA não são baratas. Se os principais fabricantes de DSA desenvolverem chips especiais, eles não apenas serão capazes de reduzir totalmente o custo médio de chips e patentes, mas também serão capazes. para competir melhor com a NVIDIA. Bom poder de barganha.

Informações públicas mostram que a Amazon não apenas projeta seus próprios servidores de computação, servidores de armazenamento e roteadores, mas também desenvolve seu próprio chip de servidor Graviton.

AWS lança processador universal Graviton4

De acordo com The Information, a Amazon continua a reduzir os preços substituindo a Nvidia por Graviton. Os clientes que alugam servidores Graviton economizam diretamente de 10% a 40% em custos de computação. Do ponto de vista da Nvidia, se você quiser manter a Amazon, o maior cliente de fábrica de nuvem do mundo, terá que sentar-se à mesa de pôquer e negociar um preço melhor.

“Este tipo de concessão de lucro às vezes pode não ser totalmente refletido no desconto, mas pode ser refletido na alocação.”

De acordo com os insiders mencionados acima, como o principal fabricante mundial, se a Nvidia der diretamente um desconto muito intuitivo no preço unitário, isso terá um grande impacto negativo no sistema de preços do produto e não conduzirá à proteção do preço do produto. , eles podem atualizar equipamentos de interconexão, atualizar armazenamento SSD, adicionar mais configurações de rack, etc., para oferecer descontos disfarçados a grandes clientes.

Existe também um método preferencial mais comum – inclinação da capacidade e concessão de direitos pela primeira vez.

Com a vantagem de ser o pioneiro, a Amazon pode definir o preço da máquina completa mais alto no curto prazo e “economizar” (desconto) dinheiro com o prêmio da máquina completa e a circulação de cadeias de ferramentas de software de suporte.

Além de garantir o fornecimento, reduzir custos e licitações, alguns grandes fabricantes querem garantir sua competitividade única, desenvolvendo seus próprios chips.

Chen Jing, vice-presidente da Fengyun Society, mencionou que os chips vendidos pela NVIDIA são adequados para computação geral e possuem funções completas, mas também são relativamente caros. No entanto, alguns clientes só precisam de funções específicas para aprimorar algumas de suas próprias vantagens. , eles considerarão o autoestudo.

“Eu só preciso fazer inferência de modelos grandes e não preciso de funções de treinamento. Nesse caso, posso projetar um chip dedicado com funções simples, mas com velocidade mais rápida e preço mais barato”, disse Chen Jing. "Grandes empresas como Google e Microsoft têm suas próprias especificações de sistema de software e hardware. Como controlar o ruído e qual nível de consumo de energia deve ser alcançado. A NVIDIA pode não ser capaz de atender aos padrões. Será mais conveniente projetar você mesmo. "

Entre os gigantes do Vale do Silício, o Google está muito preocupado com a diferenciação de sua própria arquitetura, custo e tecnologia de chip. Desde 2016, vem desenvolvendo sua própria unidade de processamento de tensor de IA (TPU) para obter melhor custo-benefício em treinamentos de grande e média escala. e inferência e desempenho para garantir suacomputação em nuvemOs produtos têm melhor exclusividade e reconhecimento.

Google lança TPU “Trillium” de sexta geração

De acordo com dados relativos à TPU de 4ª geração divulgados pelo Google, em comparação com sistemas do mesmo tamanho, a TPU v4 é 1,7 vezes mais eficiente que a NVIDIA A100 e 1,9 vezes mais economiza energia.

Além dos pontos acima, do ponto de vista ecológico, há uma razão mais profunda – quebrar o monopólio CUDA. Como linguagem de programação desenvolvida pela NVIDIA, CUDA é a principal razão pela qual os preços das GPUs foram “elevados ao céu” e os clientes têm que aceitá-los.

Se a fábrica em nuvem não fizer autopesquisa, mesmo que consiga um bom preço de pedido, mais de 95% dos processadores no data center ainda usarão GPUs NVIDIA, e toda a demanda de IA em nuvem ainda dependerá do CUDA ecossistema. Em última análise, o destino da Nvidia está nas mãos da Nvidia.

À medida que a Cloud Factory equipa os centros de dados com chips autodesenvolvidos e desenvolve muitas funções subjacentes de middleware e tradução binária para ajudar os clientes a migrar para o seu próprio ecossistema, terá um maior grau de compatibilidade equivalente com programas CUDA e a sua dependência exclusiva diminuirá gradualmente.

"Isso é o que todas as fábricas de nuvem estão fazendo. Mesmo que o processador represente menos de 4% de todo o data center, eles ainda precisam insistir em fazer isso", disse uma pessoa familiarizada com o assunto.

02 Se tem gente e dinheiro, vamos acabar com isso

“Existem pessoas, dinheiro, coisas e, ao mesmo tempo, ainda tem potencial futuro, por isso pode ser posto fim”.

 

Yu Hao, vice-presidente da Legend Holdings, acredita que a lógica dos grandes fabricantes que fazem autopesquisas sobre chips é relativamente tranquila. Seus clientes estão lá, o que é uma clara vantagem.

“As ‘pessoas’ devem ser pessoas ‘talentosas’ com experiência prática em todo o ciclo de vida dos chips, e o ‘dinheiro’ deve ser ‘dinheiro vivo’ que continue a contribuir com receitas baseadas no negócio de poder de computação. os fabricantes podem contar com o ciclo fechado de negócios de IA para avaliar as perspectivas futuras. Com o crescimento esperado do mercado, a demanda por poder de computação foi quantificada e a coordenação estratégica de pessoas e dinheiro foi concluída, chips autodesenvolvidos. vieram naturalmente”, disse Yu Hao ao Xinchao IC.

No entanto, a taxa de entrada para sentar-se na mesa de pôquer autodesenvolvida começa em pelo menos US$ 2 bilhões. No início deste ano,IA aberta O CEO Sam Altman chegou a espalhar boatos sobre um plano maluco para arrecadar US$ 7 trilhões para construir chips, embora a pessoa envolvida posteriormente tenha negado o boato.

De acordo com uma pessoa familiarizada com o assunto, “Cada empresa iterando em seus produtos de primeira geração custará pelo menos US$ 2 bilhões para aumentar a produção em massa se calculada com base no nó intermediário de 7 nanômetros”.

Além disso, os chips autodesenvolvidos são principalmente para uso próprio e não precisam levar em consideração a dificuldade de construção de um ecossistema. Ran Ciyuan citou um parceiro da Sky Eagle Capital dizendo: "O projeto arquitetônico de chips para fins especiais geralmente não precisa ser particularmente complicado, as características do aplicativo também são muito claras e o desenvolvimento é relativamente rápido. Portanto, para muitos Internet empresas, o desenvolvimento de chips para fins especiais está em um cenário claro, você não precisa gastar muito dinheiro e tempo para desenvolver o ecossistema de software, e o processo IP também está maduro.

A teoria funciona, mas como podemos fazer com que o auto-estudo funcione com sucesso?

De acordo com o conhecimento da indústria, a autopesquisa de chips pode ser dividida em partes front-end e back-end. O front-end é o design lógico, que representa as funções mais básicas do chip. O back-end é o design físico, que é a entidade que implementa todas as funções no circuito e as grava.

Diagrama esquemático do processo de chip autodesenvolvido

De modo geral, os únicos projetos que pequenas equipes podem concluir de forma independente são o front-end e back-end do chip lógico e a própria cadeia de ferramentas de software, mas mesmo assim, muitos projetos possuem apenas 5% de circuitos dedicados autodesenvolvidos.

A referida pessoa familiarizada com o assunto disse: “Todos no mercado fazem 1/5 sozinhos e pedem aos outros que façam os 4/5 restantes. Este é um ecossistema bastante maduro. Quanto à forma de obter esses IPs de circuito, alguns já o fizeram. canais ruins, e alguns são através de canais compatíveis, como licenciamento de fabricantes de design de IP como ARM.”

Para muitas equipes, eles realmente têm a capacidade de projetar alguns circuitos de forma independente, mas porque precisam superar IP que possui proteção de propriedade intelectual muito rígida, mesmo que sejam feitos, é provável que violem a arquitetura do computador e não possam ser usados, ou até mesmo infringir a propriedade intelectual de outras pessoas, este também é o primeiro obstáculo que os fabricantes nacionais enfrentam ao desenvolver seus próprios chips.

Há também algumas coisas que a equipe de autopesquisa não consegue projetar, como algumas estruturas muito difíceis de NOC (Network on Chip).

O design é apenas uma parte dos chips autodesenvolvidos. Ele também inclui fita adesiva, produção em massa, etc. Você pode encontrar vários problemas no processo, incluindo falha na fita adesiva, capacidade de produção em massa, etc., mas estes não são próprios. -desenvolvido. No final, também precisa resolver uma série de questões de apoio, incluindo como implementar a integração da cadeia industrial.

Do ponto de vista do mundo exterior, um chip lógico dedicado tem cerca de 500 mm², e uma GPU de uso geral pode ter 800 mm², contendo dezenas de bilhões ou mesmo centenas de bilhões de transistores. Algumas de suas funções são usadas para cálculos vetoriais e podem ser. considerado um processador vetorial. Mas para ser implementado em cenários de aplicação, também requer o projeto e implementação de armazenamento, controle de consumo de energia, fornecimento de energia e condições gerais de operação da máquina. Também requer interconexão e rede para formar um cluster maior.

Além disso, o objetivo final dos produtos é criar diferenciação, o que precisa ser feito na interface periférica e em toda a máquina, e diferentes SKUs aparecerão. A indústria geralmente compara armazenamento, consumo de energia e eficiência de metragem quadrada do ponto de vista de. toda a máquina.

Em outras palavras, além da integração da cadeia industrial e das questões de IP, os chips autodesenvolvidos também devem considerar os SKUs dos produtos. Não é suficiente projetar um chip lógico.

Uma pessoa sênior que desejou permanecer anônima disse ao Xinchao IC: “Muitas empresas nacionais não têm capacidade de design de produtos, elas precisam ir a vários locais para testes. Todos os dias, os data centers dos principais fabricantes esperam que a outra parte possa deixar um soquete na nova placa-mãe do servidor. Se o teste for bem-sucedido, eles comprarão um lote.

A produção em massa é outro desafio além do design, da fita adesiva e da produtização. As equipes pequenas devem considerar se podem reservar capacidade de produção?

“A produção é sempre um número muito crítico para as fábricas da Fab.” Wu Zihao, ex-especialista em construção de fábricas da TSMC, disse que os fabricantes devem entender em qual link eles entram e quanta produção prometem.

Os fabricantes de primeira linha basicamente reservaram a capacidade de produção mais recente das fábricas Fab durante o estágio DTCO (Design Technology Collaborative Optimization). Atualmente, as principais equipes de design do mundo, como a ARM, têm um grande número de pessoas estacionadas na TSMC todos os anos, incluindo. muitos fabricantes de EDA.

O DTC determina os indicadores de desempenho dos processadores de próxima geração em nós específicos, como quanto dinheiro pode ser economizado e quanto desempenho pode ser melhorado por meio de um design de layout razoável no nó de 3 nm.

“A NVIDIA e a Apple estão sempre dispostas a testar os processos de fabricação mais avançados. Contanto que a TSMC apresente um processo de fabricação de ponta, mesmo que o rendimento seja desconhecido e o ganho de desempenho seja desconhecido, ou seja, antes que o modelo econômico possa ser calculado, eles já estarão reservando capacidade de produção. O design colaborativo da DTCO com fábricas Fab é a razão fundamental para os fabricantes de primeira linha obterem capacidade de produção", disse Wu Zihao.

Se não houver design colaborativo desde o início, a Fab Factory e a equipe Fabless, Parte A e Parte B, terão que trocar de função. Como ninguém se atreve a usá-lo, a Fab Factory só poderá promover seu novo processo aos poucos. , começando com o processo de menor risco, o Chip é iniciado.

Por exemplo, os chips das máquinas de mineração têm uma estrutura muito simples e um tamanho muito pequeno, por isso são muito adequados para testes iniciais. O primeiro cliente do chip de 3nm da Samsung foi uma fábrica de equipamentos de mineração da China.

Wu Zihao disse: "Depois que a fábrica Fab testa com sucesso a água com pedidos tão pequenos de clientes, ela pode tentar produzir em massa CPUs de PC, chips de telefone celular e, finalmente, chips de IA, passo a passo."

Atualmente, os principais fabricantes nacionais investiram pelo menos bilhões de dólares em chips de desenvolvimento próprio. Se uma empresa iniciante quiser entrar no jogo, ela deve ter clientes iniciais suficientes ou uma plataforma de aplicativos para suportar a adaptação de chips e tentativa e erro, ou deve ter capital suficiente ou fortes capacidades de financiamento. ser conhecido.

Chen Wei disse ao Xinchao IC que se for uma empresa comercial sem reservas de mão de obra de baixo custo e não depender de escolas ou institutos de pesquisa, precisará de financiamento de pelo menos 500 milhões de RMB a 1 bilhão de RMB antes da produção em massa; é um instituto de pesquisa ou instituto de pesquisa. Com outros apoios, os custos trabalhistas podem ser bastante reduzidos e o limite monetário pode ser um pouco menor.

"Se você não tem tanto dinheiro, mas esta startup tem recursos de controle de custos muito fortes, ela pode fazer uso total da colaboração upstream e downstream para reduzir custos. Tudo é para garantir a continuação da pesquisa e desenvolvimento de produtos."

Em termos de prioridade de seleção Fab, segundo pessoas familiarizadas com o assunto, as startups optarão inicialmente por encomendar a capacidade de produção da TSMC, seguida pela GlobalFoundries, mas a GlobalFoundries não possui processos e embalagens avançados, e então recorrerão ao SMIC, mas ao SMIC All a capacidade de produção que pode ser reservada internacionalmente está programada para o próximo ano.

Relativamente a esta situação, as instituições de investimento adoptam uma perspectiva de longo prazo.

Yu Hao disse que apenas para chips de alta qualidade desenvolvidos internamente, é inevitável enfrentar gargalos de remoção de fita no curto prazo. O longo prazo depende da velocidade de evolução do polimento da linha de processo avançado e da expansão da capacidade representada pelo SMIC, que. depende principalmente da circulação interna. No entanto, os fabricantes com capacidades de design de chips de ponta podem querer considerar ir para o exterior e usar a circulação externa para impulsionar a circulação interna. Sair abrirá um futuro melhor.

03 Não é fácil ser o “coveiro” da Nvidia

Clientes antigos montam seus próprios negócios, e a Nvidia é sempre quem sai prejudicada.

Esta onda global de auto-investigação está a explodir mais do que a anterior. Além de resultados maduros de autopesquisa, como Google TPU e Amazon Graviton. Recentemente, todo o círculo tecnológico foi atingido por "Sohu, o primeiro chip de IA do mundo dedicado ao Transformer".

Startup de chips dos EUA Etched lança chip de IA específico do Transformer Sohu

Este chip incorpora diretamente a arquitetura Transformer no chip, e seu desempenho de raciocínio excede em muito o de GPUs e outros chips de inteligência artificial em geral. Ele é considerado 10 vezes mais poderoso que o B200, um chip de primeira linha que só foi lançado em. Março deste ano. Há rumores de que um servidor equipado com 8 chips Sohu tem desempenho comparável a um cluster de 160 GPUs H100 e pode processar até 500.000 tokens Llama 7B por segundo.

Nasceu o “popular frango frito” e a fábrica Fab e seus parceiros ficaram felizes.

É relatado que a empresa cooperou diretamente com o processo 4nm da TSMC para a produção de chips Sohu e obteve HBM e suprimentos de servidor suficientes dos principais fornecedores. Alguns dos primeiros clientes já reservaram dezenas de milhões de dólares em hardware da empresa. Os internautas deram ao Etched um apelido - "Coveiro da Nvidia".

Mas será que o mito da “autopesquisa” da NVIDIA será destruído devido à fumaça crescente? na verdade não.

Na indústria de semicondutores, existe um famoso "ciclo do Sr. Ben" - os tipos de chips evoluem regularmente entre generalização e customização - em um determinado período, a estrutura geral vende melhor e é bem-vinda entre os usuários, mas depois de atingir um determinado estágio. , as estruturas de finalidade geral ficam para trás na resposta a necessidades específicas e as estruturas de finalidade especial tornar-se-ão populares.

E a NVIDIA representa legitimamente a era da arquitetura universal, que ainda está no auge.

De acordo com estatísticas do Wells Fargo, a NVIDIA detém atualmente 98% do mercado global de aceleração de IA para data centers e está em uma posição dominante absoluta. Isso significa que 98% da população mundial está usando o CUDA C da NVIDIA para “espremer” o desempenho de todas as GPUs, e apenas os 2%-3% restantes das pessoas ainda insistem em usar um “martelo” ruim, para martelar o mesmo. "unha".

“Agora, seja Amazon ou Intel, os processadores que eles próprios fabricam não podem satisfazer economicamente a maximização dos interesses de um fornecedor de nuvem, então eles definitivamente continuarão a usar chips NVIDIA em grandes quantidades até que um dia a NVIDIA perca completamente sua vantagem. de especialização da pecuária, disse uma pessoa a par do assunto.

No entanto, deitar-se não está de acordo com a personalidade da NVIDIA. Huang Renxun é uma pessoa que sabe “nascer na tristeza e morrer na felicidade”. Em seu discurso na Universidade Nacional de Taiwan há um ano, ele disse: “Se é correr por comida”. , ou não Quando você está sendo usado como alimento por outras pessoas, muitas vezes você não tem ideia da situação em que se encontra, mas continua correndo, não importa o que aconteça.

Desta vez, enfrentando o desafio da autopesquisa em todo o Vale do Silício, a Nvidia também está jogando suas cartas.

O sênior mencionado disse ao Xinchao IC: “A Nvidia não é mais uma GPU de uso geral. Em sua unidade de GPU, você pode ver um grande número de Tensor Cores para resolver cálculos de matriz. motores, etc., seja em termos de estrutura de hardware ou atualizações de operadores de hardware, a NVIDIA está se esforçando para seguir a tendência de design baseado em DSA a cada ano.”

DSA (Domain Specific Architecture) é uma arquitetura de processador programável personalizada para campos específicos, que pode otimizar o desempenho e a relação custo-benefício de aplicações específicas. Atualmente, Google, Tesla, OpenAI e Cerebras lançaram seus próprios chips DSA para aplicações específicas.

De acordo com pessoas familiarizadas com o assunto, todos os fabricantes de DSA descobrirão que mesmo que a Nvidia não modifique o hardware e as GPUs de uso geral atualizem apenas uma operadora, as vantagens dos fabricantes de DSA serão completamente perdidas. Parece que, em comparação com a NVIDIA, não apenas a área do chip lógico não é grande o suficiente, mas a capacidade e a velocidade do dispositivo não são grandes o suficiente, o poder de computação não é tão bom quanto o da NVIDIA e a adaptabilidade do software não é boa o suficiente. o que todos os fabricantes de DSA enfrentam O problema - o ciclo Muben originalmente ia avançar para a arquitetura e personalização específicas de domínio DSA, mas agora voltou à era dos processadores de uso geral.

Além de “se olhar no espelho” com os fabricantes de DSA, a Nvidia também estendeu um ramo de oliveira à autopesquisa. No início de 2024, estabeleceu um novo departamento de negócios, liderado pela veterana em semicondutores Dina McKinney, especificamente para computação em nuvem e telecomunicações 5G. e jogos. Construímos chips personalizados para clientes de automóveis e outras áreas.

A Reuters citou pessoas familiarizadas com o assunto dizendo que os executivos da Nvidia se reuniram com representantes da Amazon, Meta, Microsoft, Google e OpenAI para discutir chips personalizados para eles. Além de chips de data center, a empresa também está buscando obter chips automotivos de telecomunicações. e cliente de videogame.

Anteriormente, foi relatado que a nova versão do console de jogos Nintendo Switch lançada pela Nintendo este ano provavelmente será equipada com chips personalizados da NVIDIA. A NVIDIA também tem uma presença profunda no mercado de portáteis e lançou uma série de chips móveis Tegra. Embora esta série de chips acabou não ocupando lugar no mercado de dispositivos móveis.

Num mercado dominado pela relação custo-benefício, não é tão fácil ser o coveiro da Nvidia. A maioria dos coveiros anteriores falhou - eles podem eventualmente ser adquiridos. Por exemplo, a Intel e o Google adquiriram muitas startups, mas a maioria das outras empresas nem esperou pela aquisição e morreu diretamente.

Talvez seja mais fácil para as start-ups terem sucesso se mudarem a sua perspetiva.

“Por exemplo, não fique obcecado com o processador de IA em si. Em vez de gastar muito tempo para cumprir o ideal de um DSA, é melhor considerar soluções em nível de sistema. fornecer serviços para o processador de IA e armazenamento profissional, sensores profissionais também podem atingir o mesmo propósito", disse uma pessoa a par do assunto.

Em 2019, a Nvidia anunciou que iria adquirir a Mellanox por US$ 6,9 bilhões. Essa avaliação foi tão alta que a Nvidia quase esgotou todo o seu fluxo de caixa.

Esta empresa não desenvolve portas nem módulos fotovoltaicos, nem desenvolve switches. Ela fabrica apenas um produto - o PHY "InfiniBand" para interconexão de alta velocidade entre a camada inferior do switch e a camada inferior da comunicação. Para a Nvidia, que na época estava ansiosa para romper as limitações da interconexão de servidores, esse era um requisito periférico muito importante. Não importa o quão bom o NVLink fosse naquela época, ele sempre estava bloqueado em uma única máquina. Mas o InfiniBand pode permitir que os switches rompam o gargalo de interconexão entre servidores e interconectem todas as GPUs em um grande cluster.

Olhando para a situação atual, a situação interna está crescendo e as balas dos chips autodesenvolvidos terão que voar por um tempo. Chen Wei acredita que construir um jogo não é uma coisa ruim, mas é necessário construir um jogo de última geração para evitar perder o período crítico para o desenvolvimento industrial.

Zhou Jiangong, o fundador da Unfinished Research, expandiu ainda mais essa visão. Ele acredita que as aplicações futuras exigirão chips de IA profissionais, personalizados e miniaturizados que excederão a demanda por grandes modelos básicos de ponta. O treinamento de código aberto, modelos menores a um custo menor, ou o ajuste fino e a destilação de modelos grandes, bem como a inferência, trazem amplo espaço para chips de desenvolvimento próprio. Além disso, nas rápidas mudanças e na fase imatura das novas tecnologias, haverá um grande número de oportunidades de auto-investigação em torno das aplicações acima referidas.

“Não faça coisas que acabem com a Nvidia, mas faça mais coisas além da Nvidia.”