notícias

o número de licitações bem-sucedidas em um único mês ultrapassou 100, e grandes modelos começaram a entrar no negócio principal das empresas estatais centrais

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

texto | zhao yanqiu e zhou xiangyue

editor | niu hui

o modelo de grande escala implementado pelas empresas estatais centrais está a entrar numa nova fase. em uma conferência em setembro, um alto funcionário da indústria disse à digital intelligence frontier que a implementação de grandes modelos não está mais limitada a um determinado setor, mas floresceu em todas as esferas da vida. também deu um grande passo em frente.

de acordo com observações da indústria, algumas empresas estatais líderes assumiram a liderança na conclusão da implementação piloto inicial de grandes modelos e começaram a avançar gradualmente para cenários mais centrais. "desde maio deste ano, à medida que a guerra de preços para grandes modelos continua a fermentar, a implementação de grandes modelos acelerou ainda mais. vários cenários começaram a ser explorados e replicados em grande escala e, a nível financeiro, o roi tem sido. ficou positivo."xie guangjun, vice-presidente do baidu, disse à digital intelligence frontline.

no segundo semestre deste ano, a implementação de modelos de grande porte voltará a avançar.em apenas dois meses e meio, o número de propostas vencedoras relacionadas com modelos de grande escala disponíveis publicamente no mercado excedeu o número total de propostas vencedoras nos primeiros seis meses do ano.. os projetos vencedores da licitação em um único mês também passaram por centenas de etapas. grandes modelos estão acelerando seu florescimento em todas as esferas da vida. entre eles, as indústrias de energia, finanças, educação, internet e outras são particularmente ativas.

sob a onda de tecnologias em rápida mudança, as trocas industriais estão a acelerar. nos últimos meses, várias grandes e pequenas conferências de ia surgiram em vários lugares, e o baidu está realizando a conferência baidu cloud intelligence 2024 em 25 de setembro. mais trocas e colisões tecnológicas estão chegando.

01

as empresas estatais centrais deram mais um grande passo em frente

2024,a china southern power grid concluiu o recrutamento e aquisição de vários grandes projetos relacionados a modelos, como "projeto de tecnologia chave do centro de treinamento básico de ia do sistema de distribuição principal da rede elétrica do sul da china - pesquisa e aplicação de tecnologia de grande modelo de pnl do sistema de energia", "pesquisa e desenvolvimento de treinamento de segurança e conjunto de funções de inferência de 2024 do china southern grid research institute para grandes modelos da indústria de energia elétrica "desenvolvimento de componentes" etc. equipes relevantes estão trabalhando com o baidu intelligent cloud para inovação conjunta.

no setor financeiro, um grande banco estatal lançou apenas um projeto piloto de pequena escala com milhares de pessoas nos cenários de assistente de atendimento ao cliente e assistente de balcão no ano passado. este ano, essas funções foram lançadas oficialmente em vários grandes centros de atendimento ao cliente. em todo o país e promovido a funcionários de balcão de linha de frente em todo o país. a atividade diária de grandes modelos chega a dezenas de milhares.

na área automotiva, uma pessoa do geely research institute disse francamente em uma conferência recente: “agora que as montadoras saem para vender carros, elas têm vergonha de vender seus produtos porque não têm modelos grandes nos carros”. grandes modelos estão lançando cockpits inteligentes e direção autônoma, e também capacitando o marketing digital, as operações do usuário e outros cenários. recentemente, eles começaram a capacitar todas as empresas sob a direção da geely.

no mercado de assuntos governamentais, os governos locais elaboraram planos modelo em grande escala baseados nas indústrias locais. “construa primeiro o centro de computação inteligente,do final deste ano até o primeiro trimestre do próximo ano, o centro de computação inteligente será implementado em grande escala e então começará a combinação de grandes modelos e indústrias locais.. "um funcionário do governo falou sobre o progresso do mercado. ciência, educação, cultura e saúde começaram a implementar o aplicativo. "alguns hospitais terciários até investiram dezenas de milhões em cenários de testes. “uma fonte médica disse que os reitores estão focados em cenários como geração de casos, gestão de pessoas, propriedades e pesquisa científica que estão intimamente relacionados aos níveis de serviço, gestão e níveis de pesquisa científica.

o porto, um importante canal de comércio de importação e exportação, também foi explorado e planejado. "vimos que muitos clientes incluíram grandes modelos em seus planos de ti para os próximos três anos." hu wei, gerente geral da baidu intelligent cloud logistics and transportation solutions, disse à digital intelligence frontline que, ao contrário das rodadas anteriores de mudanças tecnológicas, esta rodada. “há menos pessoas esperando e assistindo, mas mais pessoas experimentando.”

por exemplo, o porto de shandong, que ocupa o primeiro lugar no mundo em termos de movimentação de carga, concluiu a exploração piloto de modelos em grande escala em perguntas e respostas inteligentes e perguntas e respostas inteligentes, e essas duas funções foram lançadas para todos os funcionários.

na indústria química, a sinochem information e a baidu smart cloud estão trabalhando juntas para explorar o uso de grandes modelos para a pesquisa e desenvolvimento de novos materiais. o assistente de conhecimento "hua xiaoyi" pode fazer perguntas por meio de linguagem natural e recuperar e responder a conhecimentos profissionais. como características moleculares e rotas de síntese molecular. actualmente, a eficiência da pesquisa de moléculas específicas aumentou mais de 5 vezes e a eficiência do trabalho de investigação e desenvolvimento foi bastante melhorada.

esse entusiasmo também se reflete no mercado de licitações. dados públicos mostram quede janeiro a agosto deste ano, o número de projetos nacionais vencedores de modelos em grande escala atingiu cinco vezes o número de todo o ano de 2023, e o valor vencedor dobrou o do ano passado.. entre eles, os grandes fabricantes de modelos de cabeçotes ainda dominam a tomada de pedidos. o baidu ocupa o primeiro lugar em quatro indicadores principais: o número de modelos de projetos vencedores em grande escala, a quantidade de propostas vencedoras, as indústrias abrangidas e o número de empresas estatais centrais abrangidas.

no entanto, de acordo com estatísticas incompletas da data intelligence frontline,de 1º de julho a 15 de setembro, em apenas dois meses e meio, o número total de propostas vencedoras relacionadas a grandes modelos foi de pelo menos 286, alcançando com sucesso o número total de projetos nos primeiros seis meses do ano.

entre os compradores, os operadores, energia, educação, assuntos governamentais, finanças, etc. ainda fazem o maior número de pedidos. um sinal claro é que algumas empresas apresentaram exigências cada vez mais segmentadas, e as aquisições, tais como recolha de dados e governação, segurança de grandes modelos e cultivo de talentos, aumentaram significativamente.

por exemplo, a china southern power grid concluiu a licitação para pelo menos 15 grandes projetos relacionados a modelos dentro de dois meses e meio, de julho a meados de setembro. a state grid também concluiu a licitação para vários grandes projetos relacionados a modelos no terceiro trimestre.

li chao, gerente geral da baidu intelligent cloud energy power industry, disse à digital intelligence frontline que já em setembro do ano passado, a china southern power grid lançou um modelo independente e controlável em grande escala - "big watt". entre eles, a plataforma de modelo grande baidu intelligent cloud qianfan fornece suporte técnico para cenários de despacho de energia. no terceiro trimestre deste ano, a china southern network concluiu a seleção de grandes modelos de idiomas para o principal departamento de negócios da china southern network, e a baidu foi selecionada com sucesso como fornecedora de serviços técnicos.

02

grandes empresas enfatizam "seguir o fluxo"

quase todas as empresas que foram as primeiras a dar o salto para modelos grandes nesta rodada tinham experiência em modelos pequenos. por exemplo, o icbc estabeleceu um projeto por volta de 2021 e deseja usar um “modelo maior” para construir aplicativos de negócios como ocr. “depois que o chatgpt chegou, eles aproveitaram a situação e estabeleceram um grande projeto modelo.”

o mercado de segurança da produção está sujeito à supervisão política e é quase um resultado final para as empresas estatais centrais. anteriormente, a longyuan electric power, a maior empresa de energia eólica secundária do national energy group, adotou uma solução tradicional de segurança de modelo pequeno para gerenciar mais de 200 parques eólicos e mais de 10.000 turbinas eólicas, formando um local de produção completo desde monitoramento de segurança, análise, alarmante para o processamento em circuito fechado. no segundo trimestre deste ano, o baidu venceu a licitação para uma versão atualizada do projeto, que combinará a generalização do modelo de cv grande, reconhecimento de recursos mais preciso e a capacidade do modelo de linguagem grande de tornar as informações coletadas em grandes quantidades verdadeiramente úteis.

o que os modelos pequenos não podiam fazer antes, mas agora os modelos grandes podem agregar valor? hu wei deu um exemplo. a programação no porto, a programação de pessoal, os berços, os pátios de armazenamento, etc., foram todos feitos separadamente usando modelos pequenos no passado e os resultados foram bons.na verdade, é um problema de algoritmo matemático e o modelo pequeno é muito adequado.. no entanto, quando estes são combinados para um "agendamento integrado", os modelos pequenos não conseguem alcançar a computação colaborativa em grande escala e o planeamento coordenado entre conjuntos de dados e dispositivos. “esperamos particularmente que grandes modelos possam ser resolvidos. o desafio é a agregação de dados no porto, o que leva tempo.”

na indústria industrial, a taxa de reconhecimento dos modelos pequenos de cv tradicionais é relativamente baixa quando se deparam com amostras pequenas. com a ajuda de modelos cv grandes, a taxa de reconhecimento de dados de pequenas amostras pode ser melhorada.

muitas empresas também carecem de plataformas de gestão de conhecimento, precipitação e aplicação. agora, com a ajuda de grandes modelos e recuperação de conhecimento, as empresas podem formar capacidades de plataforma de gestão de conhecimento para completar as tarefas de tornar explícito o conhecimento tácito, estruturar o conhecimento explícito, correlacionar o conhecimento estrutural e fluidificar o conhecimento relacionado.

muitas empresas realizam reuniões de produção e operação regularmente e é muito difícil alinhar os dados. com a ajuda de grandes modelos de linguagem, os resultados podem ser resumidos e extraídos com mais rapidez e precisão, e a análise preliminar pode ser concluída, o que é de grande valor para os usuários.

03

para entrar no negócio principal, você precisa encontrar as “mãos e pés”

li chao observou que nos últimos dois anos a aplicação de grandes modelos ainda estava engatinhando, concentrada em cenários auxiliares como escritório e atendimento ao cliente. isto é completamente inconsistente com as expectativas da gestão das empresas estatais centrais com investimentos de dezenas de milhões, centenas de milhões ou mesmo dezenas de milhares de milhões. agora, os grandes modelos precisam se aprofundar no negócio principal da empresa.

“na indústria energética,estamos investindo em uma direção – otimização de simulação. "li chao disse. na indústria, há um grande número de tarefas de trabalho relacionadas a mecanismos e cálculos científicos, que não podem ser realizadas por grandes modelos de linguagem ou grandes modelos de cv. "se esses problemas não forem resolvidos, o futuro que imaginamos será ser baseado em big data é impossível implementar o modelo como um centro de capacidade para fornecer um serviço completo de agente. "li chao disse que, no futuro, os grandes modelos devem ser combinados com pequenos modelos nas áreas profissionais para penetrar nos principais cenários de negócios dos clientes.

"nos últimos anos, lançamos algumas bases nessa direção." li chao disse que o baidu fornece mecanismos de otimização de simulação e trabalha com parceiros da indústria para explorar cenários de despacho de rede elétrica, refino de petróleo e petroquímica e exploração de petróleo e gás. o despacho da rede elétrica e a estabilidade da rede elétrica projetos reais relacionados ao modelo de mecanismo, como análise de estado, otimização da operação de ilhas de energia aérea e petroquímica, dessulfurização e desnitrificação, etc., foram implementados. em setembro deste ano, o baidu também participou da licitação para o despacho inteligente da rede nacional de gasodutos.

“essas são as principais direções de produção com as quais os clientes estão muito preocupados.essas direções são as “mãos e pés” indispensáveis ​​ao usar grandes modelos como centro de agendamento no futuro para construir alguns serviços de agentes inteligentes como um todo.. li chao disse que eles farão um esforço especial no planejamento dessas "mãos e pés". o modelo grande é o cérebro. somente com essas "mãos e pés (api profissional)" os serviços de cena principais podem ser realmente realizados.

“no porto, primeiro usamos perguntas e respostas para permitir que os clientes vejam que o grande modelo original é confiável e, em seguida, gradualmente entramos no sistema de negócios principal”, disse hu wei: “nós do shandong port group já estamos planejando a próxima fase”. ., irá se aprofundar mais nos cenários de negócios.”o porto é um centro de transporte complexo. o núcleo é a expedição de mercadorias, pessoas, caminhões, pórticos, etc.. anteriormente, o sistema tos (terminal operating system) introduzido pela porta incorporava gradualmente algoritmos de ia. modelos grandes podem resolver ainda mais o problema de acesso a mais metadados.

à medida que os grandes modelos avançam em direção aos sistemas centrais de produção,uma das principais habilidades da competição global de grandes modelos é o raciocínio lógico. “em testes realizados nas instalações dos clientes, descobrimos que o raciocínio lógico de problemas complexos entre diferentes modelos de grande porte é bastante diferente. além disso, os recursos de vídeo gerados por um grande número de câmeras instaladas no porto não foram realmente utilizados.” uma direção agora é usar esses recursos originais de hardware e imagem,use grandes modelos multimodais para integração para alcançar uma melhor colaboração global. "esta é uma direção que estamos explorando."

04

74% das cargas de trabalho de ia estão na nuvem

a implementação de grandes modelos é uma engenharia de sistema complexa à medida que as empresas entram na área de águas profundas, algumas portas e caminhos para implementação estão acelerando para emergir.

"quando vamos nos conectar com os clientes, a primeira coisa que fazemos é ajudá-los a descobrir os limites do grande modelo." hu wei disse à digital intelligence frontline que, para evitar cognições inconsistentes que podem levar a problemas ou problemas de entrega tardia. que estão muito longe das expectativas do cliente a situação, agora eles têm basicamente todos os projetos,todos passarão por um processo completo de “consulta leve + implementação”.

sobre a construção do poder da computação inteligente, mostram os dados da idc,74% das cargas de trabalho de ia estão na nuvem. mas o paradigma tecnológico atual da computação inteligente mudou. na era da nuvem de cpu, todos estão mais preocupados com a flexibilidade e o melhor custo-benefício, enquanto a nuvem de gpu se preocupa se pode usar o poder de computação de um grande cluster. esses clusters não são apenas caros, mas também apresentam certas barreiras técnicas. portanto, os fornecedores de nuvem ainda são um ator importante.

além do poder computacional, a importância dos dados continua a emergir. de acordo com estatísticas incompletas da data intelligence frontier, no terceiro trimestre de 2024, a compra, recolha, gestão de dados e outras compras relacionadas estão a aumentar significativamente.

no nível dos dados, por exemplo, os dados dos clientes portuários são armazenados nos servidores de cada empresa de terminal. a huwei recomenda que os clientes criem uma equipe de dados dedicada.

quando se trata de dados, existem questões mais profundas. "hoje em dia, quando a indústria fala em grandes modelos, é preciso falar em dados, mas falando francamente, muitos deles são conversa fiada.“um membro da indústria disse francamente.

“a era dos grandes modelos,como preparar os dados, como gerenciá-los e como aplicar diferentes dados aos diferentes estágios do treinamento de grandes modelos. a maioria das pessoas ainda está tentando descobrir o elefante cegamente.. “li chao disse que o baidu também pisou em muitas armadilhas neste processo.

por exemplo, ao treinar um modelo de indústria baseado em um modelo geral, existe um guia técnico sobre como os dados devem ser combinados. se você alimentar muito pouco um modelo grande, o efeito não será óbvio; se você alimentá-lo demais, o modelo não será fácil de convergir e pode até levar a um declínio nas capacidades gerais do modelo... essas armadilhas têm. foi resolvido posteriormente, formando um conjunto de ferramentas e a metodologia é exportada para o mundo exterior por meio da plataforma qianfan e de uma equipe de atendimento técnico dedicada.

também é fácil que surjam lacunas entre a tecnologia e as aplicações dos grandes modelos, muitas "unidades de usuários não entendem a ia e as unidades de ia não entendem a indústria". li chao disse que, para resolver a lacuna, além de equipar os arquitetos de soluções com experiência no setor, eles também se concentrarão na seleção de parceiros. “basicamente escolhemos apenas dois tipos de parceiros na indústria de energia, um é a unidade industrial do cliente e o outro é a empresa que presta serviços de terceirização humana na empresa industrial do cliente, disse à digital intelligence frontline que suas características comuns são.” que ambos estejam profundamente envolvidos e compreendam o negócio do cliente, bem como o setor de ti.

além disso, durante a implementação de grandes modelos em cenas específicas,muito trabalho de engenharia ainda precisa ser feito. por exemplo, grandes modelos estão acostumados a produzir respostas na forma de "pontuação total e total", e as respostas são sempre diferentes. no entanto, alguns clientes estão mais acostumados com o método "primeira pontuação e depois total" e esperam que isso aconteça. a resposta pode ser "reproduzida". "mesmo pequenas alterações na ordem das palavras e na gramática são inaceitáveis ​​para alguns líderes portuários", disse hu wei. isso exige que eles façam muito trabalho de engenharia para garantir que o resultado do grande modelo atenda às expectativas dos clientes.

da situação geral da implementação empresarial, as necessidades dos clientes são de 360 ​​graus. curiosamente, todas as empresas de nuvem estão atualmente mudando de parceiros de nuvem para parceiros estratégicos de transformação de ia e estão atualizando suas capacidades técnicas gerais em torno da infraestrutura de ia, modelos de algoritmos, dados, otimização de implantação e personalização.

05

fator humano

o cio de uma empresa de tecnologia encontrou resistência considerável durante a construção e promoção de aplicações de grandes modelos: funcionários e departamentos da linha de frente não cooperaram, mesmo que o líder dissesse isso, seria inútil.depois que a empresa instalou o assistente de código, a eficiência geral aumentou em 1/3. "embora raramente falemos sobre a redução do número de funcionários, isso significa que as pessoas que escrevem código serão transferidas para o front-end ou back-end do desenvolvimento." consciência. estes são problemas reais.

em muitas grandes empresas em indústrias tradicionais,a maior resistência vem da inércia do trabalho. muitos funcionários da linha de frente são velhos mestres. agora, se tiverem a oportunidade de usar assistentes de manutenção de equipamentos, dirão: "se algo acontecer, é melhor eu tentar sozinho ou posso ligar para lao zhang e os três. de nós trabalharemos juntos pelo resto de nossas vidas."

o modelo grande é um projeto líder. "uma pessoa do setor financeiro observou que é necessário promovê-lo de cima para baixo. os líderes seniores apoiam projetos de referência em público. "às vezes, não se opor também é uma espécie de apoio. "

"traga o departamento de negócios no estágio inicial e participe da construção e da adoção e promoção finais", disse jin jianhua, fundador e ceo da ianalysis. assim como os assistentes de manutenção, o grupo pode ter as ideias do grupo, as subsidiárias podem ter as ideias das subsidiárias e os funcionários da linha de frente podem ter as ideias dos funcionários da linha de frente. como alinhar as expectativas de receita de todos?é uma questão de equilíbrio. por exemplo, parte da construção de mapas de conhecimento é feita por especialistas veteranos de empresas secundárias, permitindo que todos avancem em direção a um objetivo comum.

as empresas também precisam de divulgar regularmente o estado de operação e os rendimentos comerciais dos projetos de referência e fornecer incentivos publicamente. “por exemplo, dê alguns pontos aos funcionários, vincule-os a alguns sistemas e troque-os por alguns presentes.” “vamos vinculá-lo diretamente ao desempenho e aos bônus”, disse um cio de uma empresa de tecnologia. “embora seja um pouco simples e grosseiro, isso requer a cooperação da gestão e a mobilização de recursos de rh.

a retenção pela primeira vez também é importante. é necessário encontrar maneiras de melhorar a primeira experiência de login dos funcionários após a revisão e iteração. por exemplo, se a entrada for suficientemente clara e o que não era permitido antes agora for preciso, os funcionários corporativos continuarão a usá-la.

do ponto de vista do departamento comercial, podemos desenhar histórias contagiantes e gráficas, e deixar alguns mestres falarem a partir de sua própria experiência, que pode ser contagiante. a atividade diária do projeto, a atividade mensal e outros dados são igualmente importantes. estes sãocultive a cultura de ia de uma empresa

a onda de desembarque de grandes modelos continua a aumentar. sob a rápida corrente, os intervenientes de todos os setores da cadeia industrial continuam a aumentar os seus investimentos, incentivando mais empresas a alcançar o salto da inteligência digital.

o baidu também dará início a grandes movimentos em um futuro próximo, que acontecerá em 25 de setembroconferência de inteligência em nuvem baidu 2024. até então, a plataforma baidu intelligent cloud qianfan dará início a novas atualizações em ferramentas de desenvolvimento de aplicativos, grandes modelos e cadeias de ferramentas. os três principais produtos de aplicativos de ia - baidu intelligent cloud keyue, wenxin quick code·baidu comate e baidu xiling digital people irão. também será completamente atualizado, e vários subfóruns, como finanças inteligentes, indústria inteligente, transporte inteligente, assuntos governamentais inteligentes, carros inteligentes e inteligência incorporada, serão realizados simultaneamente para obter mais intercâmbios técnicos e colisões.