notícias

Executivo da Intel: Os modelos de IA passarão gradualmente da nuvem para a borda

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·O tempo de processamento na nuvem é prolongado, os custos de transmissão de dados são elevados e há preocupações com a segurança dos dados. O vice-presidente sênior da Intel, Sachin Katti, disse que a IA está penetrando até a borda e que grandes modelos podem gradualmente migrar da nuvem para a borda.


Sachin Katti, vice-presidente sênior e gerente geral do Networking and Edge Group da Intel.

"Esperamos que a IA seja implantada e aplicada mais na borda para processar dados locais. Com o tempo, os modelos de IA podem migrar gradualmente da nuvem para a borda. 24 de julho, na Intel Network & Edge 2024 Na Computing Industry Conference, Intel." O vice-presidente sênior e gerente geral da divisão de rede e borda, Sachin Katti, disse que a IA atual funciona principalmente na nuvem. Como os dispositivos de ponta geram grandes quantidades de dados localmente, o custo de transmissão de todos os dados para a nuvem é bastante alto. a computação é a tendência geral.

A segurança dos dados e a IA em tempo real promovem a IA da nuvem até a borda

Sachin Katti disse que os seres humanos estão na era da assistência de IA, e a IA ajuda os humanos a trabalhar com mais eficiência. Após a era da assistência de IA, os humanos entrarão na era dos assistentes de IA “Ao dirigir em um restaurante de fast food, os agentes de IA podem. fornecer serviços de pedidos. Os fluxos de trabalho das empresas também podem ser concluídos com IA. Em um futuro distante, poderemos descobrir que os agentes poderão interagir uns com os outros, assim como os humanos trabalham juntos para fornecer soluções em nível de departamento.”

Sachin Katti disse que o crescimento da IA ​​​​hoje está concentrado principalmente na nuvem, mas a evolução para a computação de ponta é a tendência geral “No passado, a IA de que falamos era basicamente sobre visão de máquina ou tecnologia de automação baseada em séries temporais. Mas agora a IA de ponta progrediu gradualmente da visão de máquina na ponta para aplicações de ponta, como modelos de linguagem grande e IA generativa. A Intel continuará a fornecer recursos relevantes para acelerar a implantação de IA generativa e modelos de linguagem grande na ponta.

Além dos requisitos de transmissão de dados na borda, a segurança dos dados e o desempenho em tempo real são considerações importantes na promoção da IA ​​da nuvem até a borda. Guo Wei, vice-presidente do Intel Marketing Group e gerente geral da Intel China Network and Edge and Channel Data Center Division, disse que, por um lado, as empresas têm preocupações sobre a colocação de dados na nuvem e, por outro lado, a edge computing ajuda resolver requisitos em tempo real.

"Basicamente, mais da metade de nossos clientes este ano estão explorando soluções de implementação baseadas em grandes modelos de borda." Chen Wei, vice-presidente da Intel e gerente geral da divisão de rede e borda da China, disse que, da perspectiva da implementação da computação de ponta, o tamanho do modelo não é Quanto maior, melhor, mas deve atender às necessidades reais dos cenários de aplicação do mercado “A implantação da computação de ponta precisa considerar muitos fatores, como latência, disponibilidade, otimização ajustável de microdados e segurança da informação. , etc.”

O ajuste de borda é limitado pelo volume de dados

"A borda é caracterizada pela fragmentação." Zhang Yu, diretor de tecnologia da Divisão de Rede e Borda da Intel China e engenheiro-chefe sênior de IA da Intel, disse que diferentes usuários têm requisitos diferentes de potência e desempenho de computação. Um desafio comum no ajuste de borda é a limitação do volume de dados. A quantidade de dados que uma escola ou fábrica pode realmente usar para treinamento é muito pequena. Os dados de diferentes empresas e escolas também são diferentes. As fábricas de produção de peças automotivas e as fábricas de usinagem enfrentam problemas diferentes. É impossível usar um modelo unificado para detectar defeitos do produto.

Ao mesmo tempo, Zhang Yu disse: “O treinamento requer anotações para que a máquina saiba em que você está prestando atenção. As pessoas que realmente operam o equipamento funcional de IA em uma fábrica são geralmente os trabalhadores da linha de produção. eles têm energia para fazer anotações durante o processo de produção?" Portanto, métodos de anotação automatizados precisam ser usados ​​durante o ajuste de borda para completar a anotação quando a quantidade de dados é pequena. “Na borda, os usuários finais buscam a implantação de negócios, não soluções técnicas. Os requisitos dos usuários para serviços são conveniência, facilidade de implantação e facilidade de gerenciamento após a implantação.

Guo Wei disse que não basta confiar apenas no treinamento de modelos para resolver problemas práticos da indústria, e a demanda por melhorar as capacidades de raciocínio é particularmente óbvia este ano. A implementação de grandes modelos envolverá inevitavelmente a distribuição equilibrada do poder de computação de ponta a ponta e depois para a nuvem "Se for apenas uma aplicação padrão de grandes modelos verticais, os grandes modelos serão implantados principalmente na nuvem. No entanto, devido à necessidade de implementação na indústria, o poder da computação da IA ​​será inevitavelmente empurrado para a nuvem.

Sachin Katti disse que as principais cargas de trabalho no limite são inferência e aprendizagem contínua. Às vezes, após a implantação na borda, verifica-se que o efeito não é tão bom quanto o esperado ou, à medida que funciona por um período de tempo, o modelo original precisa ser ajustado.

Quanto poder de computação é necessário na borda? Sachin Katti disse que existe uma correlação positiva entre o poder de computação e o consumo de energia. O equipamento implantado na borda consome cerca de 200 watts de energia, a implantação na nuvem consome de 1 a 2 quilowatts e o consumo de energia de um rack de camada única no data center pode chegar a 100 quilowatts. Se somarmos o consumo de energia de todo o data center, pode chegar a 50-100 gigawatts. Nos casos em que o poder de computação ou o consumo de energia são elevados, a eficiência e a capacidade de refrigeração são variáveis-chave que devem ser consideradas. Como os dados em grande escala e o poder de computação gerarão muito calor, "atualmente usamos tecnologia de resfriamento líquido para resfriar efetivamente a frota. A tecnologia de resfriamento líquido existente foi capaz de resfriar com sucesso a frota de 100 quilowatts e espera-se que será expandido para 300 quilowatts no futuro Portanto, as limitações Outro fator muito importante no poder da computação é se você tem capacidade suficiente para resfriar efetivamente o ambiente geral.”