notícias

Quando grandes modelos penetram na indústria, os cenários são a chave para a implementação |

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


"Como tecnologia, os grandes modelos devem ser verdadeiramente utilizados pela indústria e resolver problemas práticos da indústria antes que possam exercer o seu verdadeiro valor." Divisão Edge and Channel Data Center, estava conversando com Isso já foi apontado diversas vezes na comunicação com o TMTpost Media APP.

Já se passaram quase 2 anos desde que o ChatGPT foi lançado. Em menos de 2 anos, grandes modelos de IA estão penetrando em todas as esferas da vida a uma velocidade sem precedentes. Especialmente desde este ano, tanto os grandes fabricantes de modelos como as empresas do Partido A mudaram o seu foco do tamanho dos parâmetros do modelo para a forma como os grandes modelos resolvem os pontos problemáticos da indústria, tentando encontrar um ou mais grandes modelos que possam resolver os seus próprios problemas de implementação na indústria. .

Do geral à indústria, os cenários são a chave para a implementação de grandes modelos

Se a competição de grandes modelos de grandes fabricantes for dividida em duas metades, no primeiro semestre, os grandes fabricantes lançam grandes modelos gerais um após o outro e demonstram sua força melhorando continuamente os parâmetros dos modelos, no segundo semestre, quando a IA é grande; modelos são aceitos por mais indústrias Quando as empresas paralelas prestam atenção, mais e mais modelos de pequenos parâmetros estão surgindo, e os cenários de aplicação da indústria tornaram-se naturalmente o foco das empresas da Parte A e dos grandes fornecedores de modelos da Parte B. A implementação de aplicações finais tornou-se. uma questão de saber se os grandes modelos podem realmente ser realizados nesta fase. A chave para a “monetização” do lado da indústria.

A esse respeito, Guo Wei disse ao TMTpost Media APP que a Intel acredita que, à medida que a tecnologia de grandes modelos de IA penetra gradualmente na indústria, os modelos mudarão gradualmente de grandes modelos gerais para grandes modelos específicos da indústria “Neste processo, o tamanho do. o modelo mudará definitivamente. "Ao mesmo tempo, o modelo da indústria combinará mais conhecimento específico da indústria e se concentrará em um ou vários cenários específicos."

Coincidentemente, Cao Peng, presidente do comitê técnico do Grupo JD e presidente da divisão JD Cloud, também declarou publicamente no JD Cloud Summit recentemente que "os grandes modelos gerais dependem do poder da computação para se desenvolverem, enquanto os grandes modelos industriais dependem dos negócios". já são mais de 35 Wan Jingdong tem seu próprio pessoal de entrega, mais de 200.000 comerciantes, mais de 30.000 médicos, mais de 20.000 operações de compras e vendas e mais de 10.000 funcionários de P&D. Ele usa grandes aplicativos baseados em modelos em mais de 100 cenários de IA em Jingdong.

O "Livro Branco da Economia Digital Global de 2024" mostra que o número de grandes modelos de inteligência artificial no mundo atingiu 1.328, dos quais a China representa 36%. Por outro lado, os dados da IDC mostram que a IA generativa da China representará 4,6% do investimento total do mercado de IA em 2022. Com o rápido desenvolvimento da tecnologia de IA generativa, a proporção de investimento em IA generativa atingirá 33,0% em 2027, a escala de investimento excederá 13 mil milhões de dólares e a taxa composta de crescimento de cinco anos (CAGR) será de 86,2%.

Obviamente, o grande modelo é exatamente como a era anterior da computação em nuvem. Somente em termos de tecnologia, a China ainda pode estar um pouco atrás do nível de primeira classe do mundo, mas quando nos concentramos nos cenários, a China tem cenários de aplicativos ricos, e estes. cenários Esta é a chave para realmente “voar para as casas das pessoas comuns” com grandes modelos de IA.

Da nuvem até a borda, como os modelos grandes podem ser melhor usados?

À medida que os grandes modelos passam gradualmente dos grandes parâmetros dos grandes modelos gerais para os pequenos parâmetros dos modelos específicos do setor, os grandes modelos também mostram uma tendência de passar da nuvem para o lado do dispositivo. Os dados da IDC mostram que, até 2026, 80% das empresas globais utilizarão IA generativa e 50% das implementações globais de edge incluirão IA.

A este respeito, Sachin Katti, vice-presidente sênior e gerente geral da Divisão de Rede e Edge da Intel, disse uma vez que o futuro da inteligência artificial dependerá de um ecossistema aberto, e a aplicação da inteligência artificial está mudando dos data centers para a computação de ponta.

Além disso, Chen Wei, vice-presidente da Intel Corporation e gerente geral da divisão de rede e borda da China, também disse ao TMTpost Media APP que, a julgar pelas tendências de desenvolvimento deste ano, somente os clientes da Intel explorarão a implementação de modelos de borda em grande escala este ano .Há mais clientes para a solução. "Este ano é completamente diferente. Este ano pode-se dizer basicamente que mais da metade dos clientes estão explorando soluções de implementação baseadas em modelos de grande porte, e há muitos casos práticos." apontou ainda mais.

À medida que os grandes modelos avançam em direção à borda, as empresas precisam considerar muitos fatores ao implantar, como requisitos de latência, praticidade, otimização ajustável de microdados e requisitos de segurança da informação.

No entanto, a implantação de modelos de larga escala na borda ainda está nos estágios iniciais de desenvolvimento e há muitos modelos de implantação atualmente visíveis no mercado. “Através da observação da Intel, vemos que muitos clientes estão construindo soluções de hardware e software baseadas em. modelos comuns em grande escala. A otimização de desempenho é um modelo em rápido desenvolvimento", disse Chen Wei quando confrontado com a questão levantada pelo Titanium Media APP sobre como aplicar melhor modelos grandes no lado do cliente.

Ao falar sobre as tendências e perspectivas dos grandes modelos da China sendo implementados na indústria, Guo Wei disse ao TMTpost Media APP que, desde este ano, mais e mais usuários da indústria implementaram muitos modelos de grande porte da indústria “No ano passado, provavelmente foi mais para contar. histórias. Este ano temos visto cada vez mais casos de implementação na indústria, e todos são cenários que podem efetivamente resolver os pontos problemáticos da indústria", disse Guo Wei.

A julgar pela aplicação atual, os parâmetros do modelo no lado final são muito menores do que os parâmetros do modelo grande geral. Atualmente, os parâmetros do modelo no lado final estão principalmente entre 7B e 10B. Neste momento, a compactação do modelo torna-se muito. tarefa difícil. Algo importante e difícil. O modelo dominante atual consiste em injetar conhecimento específico do setor nos dados enquanto os compacta, o que é comumente conhecido como solução técnica de poda progressiva.

A este respeito, o diretor técnico relevante da JD Cloud disse ao Titanium Media APP que tomando como exemplo o cenário do veículo logístico não tripulado, através da redução de magnitude e busca de redes neurais, é possível comprimir cerca de duas vezes o número de parâmetros sem reduzir o próprio modelo . Desempenho, também pode reduzir a latência em cerca de duas vezes.

Ao mesmo tempo, Guo Wei compartilhou com a Titanium Media APP sua análise e julgamento sobre as perspectivas de desenvolvimento de modelos industriais de grande escala na China. Ele destacou que a China pode se desenvolver mais rapidamente em três aspectos.

Primeiro, o desenvolvimento do próprio modelo em aplicações industriais. Como mencionado acima, "Somente em termos de tecnologia, a China ainda pode estar muito atrás do nível de primeira classe do mundo, mas a China tem cenários de aplicação ricos em termos de implementação na indústria, especialmente em termos de integração com aplicações, na opinião de Guo Wei." , A China pode ir mais rápido, "Uma das características distintivas do mercado chinês é o rápido desenvolvimento de aplicações e a capacidade de explorar rapidamente maneiras eficazes de resolver os pontos problemáticos da indústria."

Em segundo lugar, a capacidade de raciocínio do modelo é melhorada. Quando grandes modelos são verdadeiramente aplicados na indústria, não basta confiar apenas no treinamento do modelo. Para realmente resolver os problemas da indústria, é particularmente importante melhorar as capacidades de raciocínio do modelo. capacidades também terão melhorias significativas promovidas este ano.

Terceiro, na opinião de Guo Wei, quando grandes modelos são implementados na indústria, é necessário coordenar a distribuição do poder de computação entre a nuvem, o lado do dispositivo e a borda “Se forem apenas algumas aplicações padrão de grandes modelos verticais. , os grandes modelos podem ser implantados principalmente na nuvem, mas devido à necessidade de implementação na indústria, o poder de computação da IA ​​será inevitavelmente distribuído para a borda e para o terminal”, disse Guo Wei ao TMTpost Media APP.

Muitas cenas foram implementadas

Como disse Guo Wei, desde este ano, muitos cenários de aplicação de grandes modelos industriais foram implantados no lado do dispositivo.

Em termos de educação, a Seewo lançou em conjunto uma solução "AI + Educação" baseada na tecnologia da Intel. Com a ajuda dos processadores Intel® Core™ Ultra, a Seewo pode completar a operação de grandes modelos de ensino de IA localmente, sem depender de recursos de computação em nuvem. melhorando assim a velocidade e estabilidade de resposta do sistema e garantindo uma experiência tranquila durante o processo de ensino.

No setor de varejo, Tous Les Jours criou soluções de lojas inteligentes por meio de tecnologia de computação de ponta. Esta solução pode utilizar os equipamentos de recolha de áudio e vídeo existentes na loja, e através da plataforma de gestão de integração e otimização de dados, de acordo com as necessidades e características das diferentes lojas, criar um conjunto de modelos de lojas digitais inteligentes exclusivos para as mesmas, proporcionando exposição dos produtos e serviços de loja, higiene da loja, normas dos funcionários, insights sobre multidões e fluxo de clientes, que aprimoraram as capacidades de gerenciamento diferenciado das operações das lojas Tous Les Jours, melhoraram a eficiência do gerenciamento, reduziram o custo das inspeções manuais nas lojas e fortaleceram a implementação de normas dos funcionários, acelerando o desenvolvimento inteligente da indústria de panificação.

Em termos de saúde médica, a JD Health lançou o grande modelo médico "Jingyi Qianxun" baseado no grande modelo JD Yanxi, que integra um grande número de diretrizes de prática clínica, literatura médica e conhecimento especializado, e pode concluir rapidamente a migração de vários cenários na área médica e de saúde e aprendizagem. Com base no modelo de grande escala "Beijing Medical Qianxun", lançou uma série de soluções para médicos praticantes, incluindo clínicas em nuvem, acompanhamento pós-diagnóstico, consulta conjunta de especialistas, pesquisa científica clínica, incubação de marca IP médica e " ferramentas inteligentes de assistente médico", que não apenas otimizam a eficiência e a qualidade do diagnóstico e tratamento on-line dos médicos, mas também melhoram a segurança do consultório.

Em termos de segurança, muitos fornecedores de segurança, incluindo 360, Qi'anxin, Tencent Cloud, Sangfor, etc., lançaram produtos de grandes modelos na indústria de segurança com base em capacidades de grandes modelos, ou integraram as capacidades de grandes modelos de IA em modelos originais sistemas de segurança. Entre os produtos, face aos desafios de segurança cada vez mais severos trazidos pela IA na era da IA, atingimos o objectivo de "derrotar a IA com IA".

Em termos de trabalho de escritório, muitos fabricantes propuseram o conceito de AIPC e estão se concentrando em assistentes de IA de escritório. No cenário AI Chatbot, modelos grandes podem ser rapidamente implantados em PCs Intel Core Ultra AI, e os usuários podem usar o poderoso sem problemas. texto de grandes modelos de criação, programação, cálculo matemático e capacidades de raciocínio lógico, e desfrutar de uma experiência interativa inteligente localizada conveniente e segura;

Em termos de processamento de documentos, os usuários podem usar o AI PC para processar e-mails com eficiência, formar dados, gerar documentos de trabalho automaticamente e melhorar a eficiência do trabalho. Eles também podem redigir rapidamente documentos de contrato e usar IA para analisar casos de litígio de maneira inteligente, fornecendo redação profissional de documentos. capacidades.

Os itens acima são apenas alguns cenários em que as aplicações de grandes modelos de IA são atualmente populares. Além disso, os grandes modelos da indústria também são amplamente utilizados em muitos campos, como finanças, manufatura e exploração. A era em que vários setores aproveitam os recursos dos grandes modelos de IA para capacitar os negócios já começou.

Os dados ainda são um tópico inevitável

Como todos sabemos, os dados são o "nutriente" para o rápido desenvolvimento de grandes modelos. Quer se trate de um grande modelo geral ou de um grande modelo industrial, se você deseja obter valor real e reduzir "ilusões", os dados são essenciais. falar sobre o assunto.

No que diz respeito à indústria, os grandes modelos industriais requerem dados específicos do setor massivos e ricos. Para as empresas que desejam utilizar grandes modelos industriais para reduzir custos e aumentar a eficiência, e para passar da digitalização para a inteligência digital, esta parte é muito importante. para os seus dados, as capacidades de governação apresentam requisitos mais elevados. Do ponto de vista das aplicações industriais atuais, os dados originais da empresa não são suficientes para treinar um modelo industrial completo em grande escala. A principal solução atual é usar dados sintéticos. Em seguida, por um lado, as empresas precisam de melhorar a qualidade dos seus próprios dados. Por outro lado, como seleccionar dados sintéticos excelentes também se tornou uma questão espinhosa que as empresas precisam de enfrentar.

Por outro lado, a diferença entre os grandes modelos da indústria e os grandes modelos gerais é que a maioria dos grandes modelos da indústria precisa ser implantada no lado do dispositivo ou na borda. A Gartner prevê que até 2025, mais de 50% dos dados geridos pelas empresas serão criados e processados ​​fora do data center ou da nuvem.

Em outras palavras, até 2025, a quantidade de dados do lado dos dispositivos ultrapassará 50%. Neste processo, à medida que a quantidade de dados na borda aumenta, a largura de banda de transmissão de dados também é um grande desafio que as empresas precisam enfrentar "Embora a China seja líder mundial na construção de largura de banda de transmissão para toda a infraestrutura, quando um. Quando os dados são gerados na borda, um grande número ainda pode causar tempestades na rede, e ainda precisamos otimizar ainda mais o gerenciamento da rede e as estratégias de transmissão de dados”, disse Guo Wei ao Titanium Media APP.

Olhando para o futuro, Sachin Katti disse ao TMTpost Media APP que, embora a IA direcione os dados para melhorar a qualidade, esses dados, por sua vez, apoiarão a IA para se tornar melhor, alcançando, em última análise, um ciclo virtuoso.

Obviamente, os grandes modelos entraram num período de rápido desenvolvimento na indústria. Durante este processo, as empresas devem seguir o princípio de "o cenário orientado por dados é rei", a fim de permitir que os grandes modelos sejam melhor implementados na indústria.(Este artigo foi publicado pela primeira vez no Titanium Media APP, autor | Zhang Shenyu, editor | Gai Hongda)