notícias

cinco perguntas sobre a situação atual dos centros de computação inteligente de ia|pesquisa da indústria

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

financial associated press, 2 de outubro (repórter fu jing)a escala de parâmetros de grandes modelos continua a aumentar, colocando maiores demandas na infraestrutura de poder de computação de ia. a indústria de computação de ia está atualmente em expansão e a construção de centros de computação inteligentes está se acelerando. os dados mais recentes mostram que em junho deste ano, o número total de racks de centros de potência de computação em uso em todo o país excedeu 8,3 milhões de racks padrão, com uma escala de potência de computação de 246 eflops (fp32) e uma taxa de crescimento anual de computação inteligente superior a 65%.

qual é o preço e a escassez de placas de computação do lado da oferta nesta fase? o lado da oferta corresponde ao lado da procura? todas as centenas de centros de computação inteligentes em todo o país estão operando em plena capacidade? quando será reembolsado o custo de construção de um centro de computação inteligente? como o poder da computação de inteligência artificial pode alcançar um desenvolvimento de alta qualidade? concentrando-se nas cinco questões principais, os repórteres da financial associated press entrevistaram muitas figuras da indústria.

de acordo com um repórter da financial associated press, a anterior escassez de oferta de poder de computação de ia diminuiu, mas a oferta e a procura não são completamente correspondidas, resultando em baixas taxas de utilização de alguns centros de computação inteligentes. embora os planos para centros de computação inteligentes por parte de governos e empresas locais sejam comuns, o número que pode realmente ser colocado em uso pode ser menor do que o esperado. alguns profissionais prevêem que alguns centros de computação inteligentes serão capazes de "recuperar seus custos" em cerca de três a quatro anos. ao mesmo tempo, o desenvolvimento de alta qualidade do poder computacional também é valorizado pela indústria.

o preço calculado do cartão está próximo da linha de custo do vendedor

“a oferta restrita de poder de computação é de fato um fenômeno relativamente comum nos últimos anos. muitas pessoas estão correndo para comprar produtos com bom poder de computação e boa adaptabilidade ecológica. do ponto de vista dos usuários, é claro que eles esperam que o poder de computação inteligente possa suportar melhor. aplicações." da perspectiva de um fornecedor de servidores de computação, zhang dong, cientista-chefe da inspur yunhai, disse em entrevista a um repórter da financial associated press.

zhang dong disse aos repórteres que a oferta restrita de computação inteligente é cíclica.

qual é a situação atual do lado da oferta? zhang yazhou, presidente do shanghai liuchi technology group e gerente geral da shanghai runliuchi technology co., ltd., uma subsidiária da hengrun co., ltd. (603985.sh), disse a repórteres da financial associated press: “há uma oferta de poder de computação no mercado este ano, ao contrário do ano passado, quando houve escassez. muito bem, os preços atuais de várias placas de computação estão próximos da linha de custo dos vendedores. e há também muitos intermediários. todos aqueles que costumavam fabricar computadores e equipamentos, e a indústria de comunicação de tic estão envolvidos.

recentemente, alguns players transfronteiriços de computação inteligente de ações a revelaram pressão, como: lotus purple star, uma subsidiária da lotus holdings (600186.sh), assinou alguns contratos de serviços de energia de computação.pode haver o risco de que a recuperação real dos custos de aquisição demore mais do que o esperado ou não seja recuperável., em agosto deste ano, a lotus purple star ainda está em situação de prejuízo e há incerteza sobre se poderá obter lucros ao longo do ano, negociada pela altron engine, uma subsidiária integral da oya holdings (300949.sz); com seu fornecedor runxin supply chain para assinar o "plano de cálculo". de acordo com o "acordo complementar ao contrato de aquisição de servidores de energia", o número original planejado de 128 servidores de computação de alto desempenho com chips gpu nvidia integrados foi alterado para 8.

de acordo com a observação de zhang yazhou, de junho a agosto deste ano, os preços dos terminais gpu continuaram a diminuir. “os projetos do ano passado foram todos digeridos no primeiro semestre deste ano. existem duas situações principais para os projetos que estão sendo realizados este ano: primeiro, a pesquisa e desenvolvimento corporativo realmente precisa de poder computacional, que está concentrado principalmente em grandes empresas de internet. , algumas regiões receberam subsídios e cotas de energia. aguardam o apoio à construção de um centro de computação inteligente.”

entende-se que o mercado só viu uma onda de “bens arrebatadores” em setembro, “afetada principalmente pela baixa temporada e pelo ambiente internacional, mas na verdade não há muitos recursos spot no mercado”.

o repórter também aprendeu com um membro da indústria que “o preço do 4090 aumentou anteriormente de mais de 13.000 para 16.700. no entanto, diz-se que o aumento de preço se deve principalmente à demanda relativamente alta por esta placa gráfica em “preto”. mito: wukong". poderoso.

além disso, zhang yazhou disse que o mercado ainda apresenta o fenômeno do fornecimento de energia computacional fragmentado: alguns fornecedores "podem ter apenas 5 ou 10 servidores, e os maiores têm 64 ou mais de 100 servidores, e há basicamente muito poucos servidores de grande volume esses fornecedores podemos realizar alguns pedidos avulsos de laboratórios e escolas.

oferta e demanda não são exatamente compatíveis

vários profissionais disseram aos repórteres da financial associated press que a diminuição da escassez de oferta não significa que a procura por computação inteligente seja inferior ao esperado. zhang yazhou disse que a demanda por computação inteligente está crescendo e novas demandas estão sendo constantemente geradas, mas o atual lado da demanda tornou-se mais racional.

fan congming, presidente executivo da associação da indústria de inteligência artificial de shenzhen, falou sobre a situação atual dos diferentes tipos de partes demandadas em uma entrevista a um repórter da associated press: empresas líderes e universidades de pesquisa científica têm recursos de poder computacional suficientes, enquanto grandes- modelos verticais industriais em grande escala estão atualmente sendo desenvolvidos em grandes quantidades, e pequenas, médias e microempresas há uma escassez de poder de computação.

vale destacar que a construção de centros de computação inteligentes está a todo vapor e as licitações relacionadas aumentam mês a mês.

relatado anteriormente pela digital intelligence frontier, de acordo com estatísticas incompletas, somente nos primeiros 7 meses deste ano, foram emitidos mais de 140 anúncios de licitação para projetos relacionados a centros de computação inteligente, incluindo pelo menos 24 projetos, com foco em todos os aspectos da construção como infraestrutura civil e infraestrutura de ti. o valor da proposta vencedora ultrapassou 100 milhões de yuans; mais de 40 projetos de licitação vencedores relacionados foram anunciados no mercado interno em julho.

guo liang, engenheiro-chefe do instituto de pesquisa de computação em nuvem e big data da academia chinesa de tecnologia da informação e comunicação, disse em uma entrevista com um repórter da associated press of finance durante a "2024 china computing power conference" que acabou de ser concluída: “muitos centros de computação inteligentes foram construídos em todo o país. de acordo com estatísticas completas, deveriam ser mais de 200, mas 90% deles têm poder de computação abaixo de 1000p, o que significa que esses centros de poder de computação são de uso limitado para treinamento de grandes modelos , e sua eficiência de uso futuro é questionável.”

“a demanda por poder de computação é enorme, mas os tipos existentes não conseguem atender às necessidades dos usuários. tanto em termos de adaptação quanto de custo-benefício, eles não conseguem atender às expectativas dos clientes, du yunlong, analista da idc china, disse a um repórter do financial.” imprensa associada.

zhang yazhou também acredita que atualmente existe uma situação em que o lado do fornecimento de energia computacional e o lado da demanda não correspondem completamente. “os demandantes do lado b geralmente procuram unidades com as quais estão familiarizados. na verdade, eles só podem entrar em contato com o lado do projeto.” as transações só são possíveis se a relação de cooperação for boa ou se a força abrangente for relativamente reconhecida, e isso não significa necessariamente que a transação seja pelo preço mais baixo.

o poder de computação ocioso é comum?

um repórter da associated press observou que, nesta fase, se o equipamento de computação está operando em plena capacidade tornou-se o foco da atenção do mercado.

“agora, muito poder de computação foi absorvido, mas há de fato uma pequena quantidade de poder de computação ocioso na indústria. por exemplo, pode haver um fornecimento de mil máquinas no mercado, mas pode haver centenas de máquinas ociosas ." zhang yazhou disse ao repórter da associated press.

de acordo com a observação de guo liang, o poder computacional ocioso não é um fenômeno comum "nossa equipe apoia trabalhos relacionados em muitas províncias e cidades. num futuro próximo, até onde sabemos, a taxa de utilização do centro de poder computacional de ningxia ainda será muito alta. ."

agora é mais comum vender online poder de computação na mongólia interior, no tibete e em xinjiang para aluguer de tempo partilhado a preços baixos. isto levará a baixas taxas de utilização de centros de computação inteligentes construídos em guangdong e noutros locais." fan congming disse aos repórteres.

falando sobre o centro de computação inteligente de ningxia, guo liang analisou que, embora o preço geral da eletricidade local não seja atualmente subsidiado, ainda tem vantagens, o centro de computação inteligente local tem um poder de computação maior e é mais útil para o treinamento de grandes modelos; "além disso, para a computação inteligente, os requisitos de desempenho para a transmissão em rede não são tão fortes e os dados podem ser completamente processados ​​offline. este é um cenário de aplicação melhor para centros de computação inteligentes no centro e oeste do meu país."

"a julgar pelo grau de digestão do poder de computação no início da construção, as empresas líderes deveriam representar 80%, as universidades de pesquisa científica deveriam representar cerca de 30% -40%, e o grau de digestão do poder de computação para a construção orientada para o mercado deveria ser cerca de metade." fan congming disse aos repórteres.

de acordo com a observação de fan congming, empresas líderes como byte, tencent, huawei e baidu "treinam continuamente grandes modelos. quanto maior a quantidade de dados, maior a demanda por poder de computação, e quase não há poder de computação ocioso". o poder de computação das universidades de pesquisa científica "foi construído" grande, menos usado ", poder de computação relativamente mais ocioso; poder de computação ocioso em pequenas e médias empresas é relativamente comum. devido ao posicionamento pouco claro, à localização remota e ao alto preço, a digestão do poder de computação no início da construção não é suficiente. "

du yunlong acredita que a ociosidade do poder de computação depende principalmente de vários aspectos: a mobilização do poder de computação pelo software de camada superior, o método de interconexão entre o hardware, a adaptação das instalações de hardware aos cenários de aplicação e os custos de implantação do usuário.

no início de setembro, o vice-presidente da tencent cloud, sha kaibo, também falou sobre o fenômeno de que, embora o centro de computação inteligente tenha recursos de hardware, ainda carece de recursos de software de suporte, carece de clientes finais reais ou cenários de aplicação em uma entrevista com um repórter da financial associated imprensa.

zhang yazhou disse que as razões por trás do poder de computação ocioso são complexas e estão relacionadas ao desempenho de vários cartões de computação inteligentes, à operação das partes do projeto e às capacidades de serviços técnicos dos produtos de rede. produtos do lado da aplicação para fora.

quantos anos serão necessários para pagar o custo de construção de um centro de computação inteligente?

o poder de computação ocioso levou a custos excessivos em alguns centros de computação inteligentes, o que é uma das preocupações comuns na indústria.

a este respeito, fan congming acredita que o preço de fornecimento dos centros de computação inteligentes é muito caro e os utilizadores não podem pagar, o que leva a uma continuidade insuficiente da computação nos centros de computação inteligentes e a custos excessivos.

falando sobre a operação do centro de computação inteligente, guo liang disse a repórteres da financial associated press durante a "2024 china computing power conference", "recentemente, você verá frequentemente informações sobre a plataforma de agendamento de energia de computação em várias ocasiões, mas o que será será o efeito depois de construído? entende-se que alguns lugares investiram dezenas de milhões para construir plataformas, mas devido a questões como conceitos de design e recursos funcionais, eles não foram bem utilizados. centro de computação inteligente é particularmente importante.”

ele disse ainda: "para a computação inteligente, até mesmo o investimento governamental precisa de retornos, muito menos das empresas. agora a indústria está realmente em uma situação de disputas entre heróis, mas não existe um papel unificado. é claro que também estamos trabalhando duro. desta vez, a china computing service platform (henan), lançada na computing power conference, é uma solução que lançamos.”

(fotografado por um repórter da financial associated press na china computing power conference de 2024)

sobre como os centros de computação inteligentes equilibram custo e desempenho, fan congming disse a um repórter da associated press: "o período de retorno do investimento em energia de computação é geralmente de cerca de cinco anos, porque o mercado de energia de computação muda muito rapidamente e outros custos, como contas de eletricidade e as operações devem ser adicionadas, se possível. se for usado por um grande fabricante, acho que o tempo de retorno será de cerca de três a quatro anos.”

du yunlong acredita que os operadores de centros de computação inteligentes devem formular planos de longo prazo para reduzir os custos de uso do usuário final, cultivar hábitos de uso e retomar os preços no futuro, concentrando-se no cultivo de casos de aplicação e expandindo gradualmente a cobertura da indústria;

qual é a explicação para mudar de “quantidade” para “qualidade”?

falando objectivamente, o desenvolvimento do poder computacional da china ainda tem um longo caminho a percorrer.

o "china computing power development report (2024)" divulgado pela 2024 china computing power conference mostra que, no final do ano passado, o mercado global de computação inteligente cresceu mais de 130% ano a ano, enquanto os chineses o mercado de computação inteligente cresceu mais de 60% ano a ano.

um repórter da associated press notou que em meio ao boom na construção de poder computacional, alguns profissionais compartilharam muitos "pensamentos frios" nas conferências acima mencionadas e se concentraram no poder computacional de alta qualidade.

o primeiro sistema de avaliação de poder de computação de alta qualidade do setor, "relatório do sistema de avaliação de desenvolvimento de alta qualidade de poder de computação de inteligência artificial", lançado pela inspur information (000977.sz) e pela academia de tecnologia da informação e comunicação, afirmou que o poder de computação de alta qualidade é baseado em a mais recente teoria de inteligência artificial e usa arquitetura de computação de inteligência artificial avançada, recursos de computação de alto nível combinados com algoritmos e profundidade de dados.

um repórter da associated press aprendeu com a inspur information que a diferença entre o desempenho medido e o desempenho teórico do cluster de poder de computação atual é muito grande. o desempenho real de parte do poder de computação é inferior a 10% do desempenho teórico. dados públicos mostram que a taxa média de utilização de gpu de centros de computação inteligentes no modo tradicional é inferior a 30%.

zhang dong acredita que a atenção ao poder da computação não pode se concentrar apenas nos chips “muitos lugares compram poder de computação, nomeiam as marcas de chips e constroem um centro de computação em grande escala. é preciso olhar para a perspectiva do sistema. considerar de forma abrangente como atender às necessidades da aplicação.”

guo liang também disse: "atualmente, não temos muitas opções no nível do chip. mas a integração da computação e da rede é um ponto quente. o objetivo é expandir um servidor de ia dos atuais 8 cartões para 32 cartões ou 512 cartões. isso será benéfico para os recursos de clusters de computação inteligentes, incluindo implantação, lançamento, operação e manutenção de cluster.

os repórteres da associated press aprenderam em várias entrevistas que a implementação da computação inteligente em grande escala não é de forma alguma um simples empilhamento de escalas e quantidades. sua complexidade aumenta exponencialmente, o que impõe altas demandas à força técnica, às vantagens de recursos e à colaboração industrial. capacidades dos operadores de construção de computação inteligente.

quanto à forma como o centro de computação inteligente pode passar de "quantidade" para "qualidade", guo liang disse: "a construção de um centro de computação inteligente requer 'avanço moderado' e análise e previsão gerais com base nas necessidades locais reais".

(repórter da financial associated press fu jing)
relatório/comentários