notícias

Investimento em construção da CITIC: O investimento da tendência global da indústria de IA depende do poder da computação A IA final abre mais possibilidades.

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A Zhitong Finance APP aprendeu que a CITIC Construction Investment divulgou um relatório de pesquisa afirmando que o poder da computação ainda é a força motriz fundamental para a iteração contínua de grandes modelos. Existem três linhas principais de investimento em poder de computação. A primeira é em torno de mudanças incrementais, como conexões de cobre, refrigeração líquida, etc.; a segunda é em torno de mudanças de compartilhamento, como armazenamento, PCB, fonte de alimentação, etc.; é sobre se o crescimento do desempenho da NVIDIA excede as expectativas. Até certo ponto, determina a faixa de avaliação de toda a cadeia da indústria de energia de computação.

A CITIC Construction Investment destacou que é tendência geral a IA avançar para o lado do terminal. O sistema operacional de IA nativo da Apple e os aplicativos criados pela Apple Intelligence estão liderando o caminho, e o assistente de IA do lado do PC da Microsoft também está acelerando, prestando atenção à onda de substituição de máquinas de ponta a ponta e DRAM atualizado, computação de privacidade, acústica, bateria, dissipação de calor e Arm PC e outras oportunidades de investimento.

Com a melhoria das capacidades dos grandes modelos nacionais, o declínio nos preços das chamadas e o apoio político, a CITIC Construction Investment acredita que mais aplicações de IA serão gradualmente implementadas. Robôs de bate-papo C-side, imagens de Vincent e aplicativos de vídeo de Vincent estão sendo gradualmente aceitos. A IA do lado B também começou a ser implementada em finanças, indústria, militar, assistência médica, educação e outras áreas.

As principais opiniões do CITIC Construction Investment são as seguintes:

Olhando para a segunda metade do investimento em IA, acreditamos que existem duas direções principais de investimento:A primeira são as tendências globais da indústria, cujo núcleo é o poder da computação; a segunda é o estímulo da procura interna em torno das políticas internas, especialmente a combinação da IA ​​com as indústrias do lado G e do lado B.

Existem três lógicas de investimento no campo do poder computacional: Primeiro, com foco no investimento em mudanças incrementais, a mudança mais importante no segundo semestre do ano é o desenvolvimento e transição da forma de servidor de IA das últimas 8 placas para gabinetes NVIDIA NVL36 e 72. A integração do gabinete é maior e é a principal. escolha de muitos grandes fabricantes. Entre eles, conexões de cobre e refrigeração líquida são novos incrementos. Eles entrarão em um período de pedidos intensivos no segundo semestre deste ano e começarão a catalisar o desempenho a partir do quarto trimestre. à medida que as encomendas das empresas líderes transbordam, toda a cadeia da indústria mostra um elevado grau de prosperidade, a participação de algumas empresas aumentou, concentrando-se no armazenamento, PCB, fornecimento de energia e outros sectores, flutuações de avaliação, o sistema de avaliação global de; O poder de computação de IA refere-se à NVIDIA, se o crescimento do desempenho da NVIDIA excede as expectativas, até certo ponto determina toda A faixa de avaliação da cadeia da indústria de energia de computação, com base no ritmo de expansão Cowos da TSMC, irá acelerar no segundo semestre do ano. sobre o desempenho da Nvidia no segundo semestre do ano e, portanto, também estão otimistas sobre a mudança de todo o setor para a avaliação do próximo ano. Ao mesmo tempo, no Simpósio Europeu de Tecnologia em abril, a TSMC anunciou que expandirá a capacidade de produção de CoWoS a uma taxa composta de crescimento anual (CAGR) de mais de 60% até pelo menos 2026. Pode-se ver que a TSMC está otimista quanto à demanda geral por IA.

O valor das ligações de cobre aumentou significativamente e aumentará em volume no segundo semestre: 1) Crescimento significativo no uso: Em comparação com os servidores de 8 placas anteriores, que usavam principalmente cabos PCIE, desta vez o gabinete NVL36/72 usa cabos PCIE não apenas na bandeja de computação, mas também entre as bandejas de computação, entre o chip de comutação e o backplane, e entre o chip de comutação e o backplane. Cabos de cobre de alta velocidade são usados ​​para conectar as portas de E/S do painel frontal, e conexões de cobre de alta velocidade também podem ser usadas para interconectar diferentes gabinetes. começará a aumentar em volume no segundo semestre do ano: Segundo a TrendForce, a nova plataforma Blackwell entrará no mercado no terceiro trimestre, a partir do quarto trimestre Aumentará o volume. Olhando para o próximo ano, a série Blackwell se tornará o principal produto de vendas da NVIDIA e será principalmente na forma de gabinetes. Para os fabricantes chineses, a principal oportunidade para conexões de cobre vem do excesso de pedidos da Amphenol. Considerando o volume geral de remessas de gabinetes NVL36 e NVL72 no próximo ano (o NVL72 equivalente deverá ser de 40.000 a 50.000 unidades), apenas cabos de cobre de alta velocidade. nos armários O mercado sozinho atinge 4,8-6 bilhões de RMB. Se considerarmos fora do balcão, o tamanho do mercado será ainda maior.

A demanda de memória na nuvem está em alto nível: 1) A demanda por centros de potência computacional é grande: o valor da memória de vídeo representa uma grande proporção. A demanda total por HBM3e e LPDDR5x em um gabinete NVL72 é de cerca de 207.400 dólares americanos, representando cerca de 7% do valor do NVL72. gabinete 2) Demanda por equipamentos finais: a longo prazo, a demanda por equipamentos finais A quantidade de parâmetros do dispositivo lateral continuará a aumentar e a memória continuará a aumentar A memória do telefone móvel AI da próxima geração é. espera-se que aumente para 12-16 GB. O núcleo das oportunidades de investimento nesta cadeia da indústria são dois pontos: 1) participação HBM3e e mudanças nos fornecedores de DRAM de 8 GB para celulares da Apple e DRAM de próxima geração, com foco na Micron 2) Atualmente, para os principais fabricantes de armazenamento, o foco principal está em; conversão e, no futuro, o equilíbrio entre a oferta e a procura de armazenamento pode ser quebrado, fazendo com que os preços de armazenamento continuem a subir.

Nova atualização da solução de fonte de alimentação: O servidor adota um design integrado em rack e usa uma fonte de alimentação externa unificada para otimizar ainda mais o gerenciamento de energia e melhorar o desempenho geral e a confiabilidade do sistema. O NVL72 requer 6 prateleiras de energia e um único gabinete requer uma fonte de alimentação de cerca de 200 kW. O módulo DrMOS é a unidade de alimentação específica da GPU, e a demanda por módulos DrMOS para chips da série B continua a aumentar. Os principais fornecedores são Delta e Lite-On, e estamos atentos ao progresso dos fornecedores do continente.

Aplicação abrangente de refrigeração líquida: Atualmente, o resfriamento líquido é baseado principalmente em placas de resfriamento e tipos de imersão. Em comparação com o resfriamento a ar tradicional, o resfriamento líquido tem três vantagens no contexto do aumento da intensidade do poder de computação: 1) Os gabinetes de resfriamento líquido têm um limite superior de consumo de energia mais alto e podem transportar. 20 KW Os servidores de IA acima estão em execução; 2) o valor PUE da sala de computadores com refrigeração líquida está mais próximo de 1, atendendo aos requisitos da política mais recente; a vantagem do custo operacional a longo prazo é significativa. No geral, o aumento na taxa de penetração do resfriamento líquido é uma tendência inevitável na era do poder computacional altamente intensivo.

Principais tendências de investimento no lado final da IA: O primeiro é o aumento da DRAM: para um modelo com 3 bilhões de parâmetros, o uso de memória calculado com precisão Int 4 é de cerca de 1,4 GB. É difícil para a DRAM de 6 GB suportar grandes modelos de IA. Atualmente, os únicos modelos que podem suportar este modelo grande são os telefones celulares da Apple equipados com 8 GB de DRAM. Acreditamos que se a Apple atualizar seu modelo ponta a ponta para 7 bilhões de parâmetros, o uso de memória chegará a 3 GB e será muito difícil suportar os modelos existentes de 8 GB no futuro, com cada geração de atualizações de telefones celulares. A atualização da DRAM da Apple será ainda mais difícil. No lado do Android, entre as séries Pixel 8 mais recentes do Google, apenas o Pixel 8 Pro suporta a execução do modelo grande de IA Gemini porque é equipado com 12 GB de DRAM. A segunda são questões de segurança e computação de privacidade: No futuro, os telefones móveis AIPC ou AI formarão uma base de conhecimento local. É crucial garantir a segurança das informações pessoais. atualizado. Além disso, a Apple Intelligence analisará se as solicitações enviadas pelos usuários podem ser executadas no dispositivo. Se for necessário um poder de computação mais forte, a computação em nuvem privada pode ser usada para enviar apenas dados relacionados a tarefas para servidores que usam chips da Apple. no futuro, a fábrica construirá seu próprio centro de raciocínio em nuvem para serviços de telefonia móvel. A terceira é a atualização da acústica: a interação por voz será uma entrada importante para a era da IA, e um ponto muito importante no final é a atualização dos dispositivos acústicos. Em quarto lugar, a bateria e a dissipação de calor mudaram significativamente: à medida que o poder de computação do chip terminal aumenta, o consumo de energia aumenta, a bateria fica maior e os materiais de dissipação de calor também mudam. A quinta é prestar atenção às mudanças na demanda por equipamentos de inspeção de visão mecânica provocadas pelas novas mudanças no hardware do iPhone 17. Sexto, Arm PC: Com vários fatores, incluindo capacidades de IA mais fortes, maior duração da bateria, o principal suporte da Microsoft e o foco da Qualcomm na construção de chips de PC, os principais fabricantes começaram a se concentrar no lançamento do Arm PC.

Tesla lidera a revolução ponta a ponta na direção autônoma: Tesla FSD Beta V12.3 é a primeira versão do FSD a usar uma rede neural ponta a ponta. De acordo com os dados de segurança mais recentes divulgados pela Tesla, depois que a função FSD é ativada, os veículos Tesla só podem ocorrer a cada 5,39 milhões de milhas dirigidas. . Um acidente está bem abaixo da média nacional de um acidente a cada 670.000 milhas dirigidas. Em comparação com algoritmos anteriores, os modelos grandes têm quatro características e vantagens importantes: 1) Orientado por dados: No passado, a condução autônoma era definida por regras escritas, mas agora é orientada por dados Cada vez que você assiste de 1 a 1,5 milhão de videoclipes. , o efeito será óbvio Melhoria; 2) Limite superior elevado: A capacidade de surgimento de modelos grandes também se reflete atualmente na direção autônoma, o que significa que aumentar o número de parâmetros pode resolver alguns comportamentos de direção que eram difíceis de resolver na direção autônoma. processo no passado; 3) A velocidade de iteração é acelerada: no passado, Tesla itera o algoritmo FSD quase a cada duas semanas e atualiza a versão a cada 2-3 dias na era do modelo grande 4) A experiência de direção é próxima da humana; : O piloto automático definido por regras no passado era muito rígido, mas a experiência atual é mais semelhante à sensação de direção humana, reduzindo assim o número de aquisições. Tesla também anunciou uma série de dados para FSD12.3. A quilometragem média de aquisição aumentou de 116 milhas para 286 milhas, e a proporção de viagens de usuários sem aquisição aumentou de 47% para 72% no FSD V11.4. melhoradas, as capacidades de condução assistida dos automóveis de passageiros foram melhoradas ainda mais, com foco no Desay SV. No entanto, para a condução autónoma de nível L4, a quilometragem média de aquisição da Tesla ainda está muito aquém da dos humanos. Actualmente, não é possível realizar totalmente a condução autónoma apenas confiando na inteligência de um único veículo, e é necessário prestar atenção à construção. da nuvem Chelu doméstica.

As aplicações de IA capacitam milhares de indústrias: Outro campo de batalha principal para a aplicação de modelos de grande porte é a aplicação industrial. Em 26 de maio, em um simpósio de empresas e especialistas na província de Shandong, foi destacado o uso da tecnologia para transformar as indústrias tradicionais. Em segundo lugar, os títulos do tesouro de ultralongo prazo também serão fortemente investidos em áreas como “autossuficiência e autossuficiência através da ciência e da tecnologia”. Ao mesmo tempo, o "Esboço do Plano Estratégico para a Expansão da Procura Interna (2022-2035)": Implementar firmemente a estratégia de expansão da procura interna e cultivar um sistema completo de procura interna. Também se concentra na promoção da integração profunda de 5G, inteligência artificial, big data e outras tecnologias com transporte e logística, energia, proteção ambiental ecológica, conservação de água, resposta a emergências, serviços públicos, etc., para ajudar a melhorar as capacidades de governação de áreas relacionadas. indústrias. Acreditamos que a IA está começando a ser implementada nas áreas financeira, industrial, educacional, de transporte, militar, médica e outras. No lado financeiro, os grandes modelos tornaram-se gradualmente melhores assistentes de pesquisa de investimentos, humanos virtuais de gestão de patrimônio, bases de conhecimento financeiro, etc. No lado industrial, grandes modelos começaram a fornecer interação humano-computador, geração de amostras AIGC, etc. em CAD e outros softwares, com foco na tecnologia de controle central. No campo dos robôs, a inteligência dos robôs após serem conectados a grandes modelos aumentou rapidamente e eles começaram a substituir os humanos na realização de tarefas simples em fábricas e outros cenários. No campo militar, a empresa estrangeira Palantir utilizou com sucesso modelos grandes como assistentes de campo de batalha. No campo da educação, a IA está gradualmente se tornando um professor virtual em mais disciplinas. No campo dos transportes, a colaboração carro-estrada-nuvem impõe requisitos mais elevados para a infraestrutura. Ao mesmo tempo que permite a gestão inteligente do tráfego, pode efetivamente reduzir o custo da condução inteligente de veículos. Na área médica, no passado, a própria IA teve aplicações relativamente profundas (modelos tradicionais) em campos como imagens médicas e pesquisa e desenvolvimento de novos medicamentos. O surgimento de modelos generativos aprofundou ainda mais o desenvolvimento da IA ​​nos itens acima. No entanto, em geral, a direção da pesquisa e desenvolvimento no exterior é mais tendenciosa. Para os produtos farmacêuticos, a direção da pesquisa e desenvolvimento nacional está mais focada na gestão da saúde. modelos.

aviso de risco

Espera-se que a recessão económica norte-americana aumente gradualmente, e há uma grande incerteza no ambiente macro. As mudanças no ambiente internacional afectam a cadeia de abastecimento e a escassez de chips no exterior pode afectar a produção e entrega normais de empresas relevantes, e as remessas das empresas; são inferiores ao esperado; a informatização e a digitalização A procura e as despesas de capital são inferiores ao esperado; a concorrência no mercado intensificou-se, resultando num rápido declínio nas margens de lucro brutas; as flutuações das taxas afectam as receitas cambiais e as margens de lucro bruto das empresas orientadas para a exportação; as grandes iterações de actualização do algoritmo do modelo não são tão eficazes como esperado, podem afectar a evolução e expansão dos grandes modelos, o que por sua vez afectará a sua comercialização; e a inteligência industrial não é a esperada.