notícias

na batalha pelo lançamento de modelos grandes, como o baidu pode avançar?

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

depois de mais de um ano de pesquisa, os modelos grandes são realmente “populares”?

em relação aos grandes modelos, parece haver discussões intermináveis: buscar “grandes parâmetros” ou considerar a “lei de escala”? qual estrutura é melhor, “densa” ou “esparsa”? “linguagem” ou “multimodalidade”: quem é o verdadeiro futuro dos grandes modelos? os jogadores têm uma posição clara e opiniões próprias, mas esta popularidade parece nunca ter sido transmitida ao mercado mais estabelecido.

entre os principais fabricantes, o baidu é um dos poucos que implementou engenharia de modelos em grande escala - de acordo com o relatório financeiro do segundo trimestre de 2024 do baidu divulgado hoje, ele mostrou uma receita trimestral total de 33,9 bilhões de yuans, a receita principal do baidu de 26,7 bilhões de yuans, o lucro operacional do baidu core foi de 5,6 bilhões de yuans, um aumento anual de 23%.

o grande modelo da wenxin tem mais de 600 milhões de chamadas diárias e a ia gerou receitas de nuvem de 5,1 bilhões de yuans, um aumento anual de 14%.

trazer a ia “flutuando” no céu de volta ao solo pode alcançar tais resultados. o que o baidu fez certo?

o número de chamadas continua a crescer, contando com reduções de preços e mais com força

vamos começar com os dados mais atraentes do relatório financeiro do segundo trimestre do baidu: o aumento nas chamadas para o grande modelo de wenxin.

o número de chamadas diárias ultrapassa 600 milhões e o número médio de tokens processados ​​por dia ultrapassa um trilhão. por trás do crescente número de ligações, as pessoas sempre se lembram da enorme “guerra de preços dos grandes modelos” em maio deste ano, que atraiu a atenção de toda a indústria.

nesta batalha, os esforços de redução de preços do baidu podem ser descritos como “feroz”:

a batalha começou rapidamente e o baidu anunciou diretamente que os serviços predefinidos dos modelos das séries ernie-speed, ernie-lite e ernie-tiny seriam gratuitos;

em julho deste ano, durante o waic, o baidu smart cloud anunciou novos cortes de preços, reduzindo significativamente os preços dos dois modelos principais ernie 4.0 e ernie 3.5, com entrada e saída tão baixas quanto 0,03 yuan/mil tokens e 0,06 yuan/mil tokens, respectivamente. .

basta remover o limite de preço e, naturalmente, muitos usuários entrarão correndo. em particular, muitas empresas e instituições grandes, médias e pequenas já não se preocupam com os custos e têm entusiasmo para experimentar modelos grandes.

a queda dos preços reduziu, de facto, o "empurrão" para os clientes telefonarem;e a competição por modelos grandes é tão acirrada. mesmo que o preço seja menor, principalmente quando o preço já é extremamente baixo, por que o wenxin pode se destacar?

um artigo analisou há muito tempo que a capacidade do baidu de realizar uma transferência de lucros tão quase decisiva depende essencialmente da tecnologia de ia full-stack mais avançada do baidu, que lhe dá a confiança necessária para liberá-lo e reduzir os preços.

desde o nascimento do wenxin big model, ele acompanhou de perto a tendência dos tempos. a eficiência média de treinamento semanal do wenxin big model atingiu 98,8%. em comparação com quando wenxin yiyan foi lançado, a eficiência do treinamento aumentou para 5,1 vezes. a inferência é 105 vezes. o custo da inferência cai para o 1% original. em junho, o baidu também lançou o flying paddle 3.0. esta atualização melhorou significativamente a compatibilidade da estrutura do flying paddle com a infraestrutura de ia do baidu e os grandes modelos wenxin, e espera-se que reduza ainda mais os custos de inferência de modelos no futuro.

o baidu fez uma análise muito profunda dos atuais pontos problemáticos dos grandes usuários de modelos - o primeiro tipo de ponto problemático para os usuários é o limite relativamente alto para a implementação de aplicativos e como desenvolver rapidamente aplicativos apropriados com base em cenários, enquanto o segundo tipo de; o ponto problemático é para cenários específicos, como usar modelos especiais para atender às necessidades do seu próprio setor.

essencialmente, para que um produto tecnológico faça com que os utilizadores o comprem, a primeira prioridade continua a ser a “disponibilidade” e a “facilidade de utilização” do produto tecnológico.

apenas um dia antes da divulgação do relatório financeiro, o baidu anunciou suporte para o ajuste fino de seu principal modelo ernie 4.0 turbo. anteriormente, a plataforma de modelo grande baidu qianfan suportava ernie 3.5, ernie speed, ernie lite, ernie tiny e ernie character para ajuste fino do modelo. até agora, um total de 6 modelos grandes wenxin podem ser ajustados na plataforma qianfan. .o ajuste fino cumulativo produziu 21.000 modelos, atendendo aos principais cenários de negócios de mais de mil empresas, e possui muitos cases de sucesso.

no campo dos assuntos governamentais, a federação de sindicatos de toda a china e a baidu smart cloud usaram recursos de ia em consultas jurídicas, permitindo que os trabalhadores entendessem as questões jurídicas com mais precisão, calculassem os valores das compensações trabalhistas com mais rapidez e fornecessem soluções mais personalizadas por meio de grandes modelos avaliação completa do caso.

comparado com os métodos de desenvolvimento tradicionais, este sistema, que exige precisão e velocidade de feedback extremamente altas, foi entregue em apenas um mês, o que representa uma melhoria significativa na eficiência em comparação com o ciclo de entrega tradicional de 3 a 6 meses.

se a produtividade puder ser melhorada e mais usuários puderem ver esse valor, será difícil não aumentar o número de chamadas para o grande modelo da wenxin.

os negócios em nuvem estão crescendo rapidamente, contando com maas e ferramentas

o rápido desenvolvimento da ia ​​trouxe resultados diretos para o baidu, que é o crescimento contínuo dos negócios em nuvem da empresa.

o relatório financeiro revelou que no segundo trimestre, a receita do baidu smart cloud foi de 5,1 bilhões de yuans, um aumento anual de 14%, e a receita de ia representou 9%, superior aos 6,9% do trimestre anterior.

trate um excelente modelo grande como um cartão de visita e o negócio em nuvem que está intimamente integrado a ele será naturalmente conduzido de acordo. a grande prosperidade dos aplicativos de ia fez com que a nuvem gpu se tornasse gradualmente a "configuração padrão" nas compras empresariais.

como resultado, o modelo de modelo como serviço (maas) está gradualmente subindo ao palco e se tornando uma nova adição ao crescimento do baidu cloud.

de acordo com o último relatório da idc, o baidu intelligent cloud ocupará o primeiro lugar na participação de mercado de plataformas de grandes modelos da china em 2023, atingindo 19,9%. da mesma forma, entre os quase 260 projetos modelo de grande escala que foram anunciados como licitantes vencedores na china este ano, o baidu lidera a classificação dos licitantes vencedores. entre os principais fabricantes de modelos de grande escala, o baidu tem o maior número de projetos vencedores, cobre a maioria das indústrias e ganhou mais de 64 milhões de yuans em licitações, ocupando o primeiro lugar entre os três.

durante o período de lançamento do modelo grande, a plataforma qianfan "fez fortuna" e atendeu um total de 150.000 clientes. ela fez esforços em muitos setores, como assuntos governamentais, energia elétrica, educação, etc., e tem feito esforços. o reconhecimento não só ganhou reconhecimento do mercado pelos seus produtos técnicos, mas também traz feedback para a sociedade na forma de melhorias de produtividade.

nas áreas rurais de henan, chongqing e outros lugares, qianfan está promovendo os "grandes modelos que vão para o campo", permitindo que os moradores entreguem com segurança os problemas mais triviais e demorados, como pagamento de seguro médico e processamento de registro familiar, para a assistência. de grandes modelos.

ao encontrar problemas que são difíceis de cobrir com precisão na base de conhecimento do governo local, o grande modelo também pode combinar a pesquisa do baidu para fornecer respostas e responder automaticamente à pessoa que faz a pergunta, trazendo serviços convenientes 24 horas por dia para o campo.

atualmente, os assistentes residentes já entraram em mais de 6.000 aldeias, permitindo que as pessoas comuns desfrutem de uma vida mais inteligente.

para fazer com que os clientes se sintam "disponíveis" e "fáceis de usar", a comercialização de modelos grandes do baidu depende mais da atualização da cadeia de ferramentas de modelos grandes.

cultivar profundamente as atualizações da cadeia de ferramentas é um dos principais temas do desenvolvimento tecnológico do baidu este ano.

do ponto de vista do ajuste fino do modelo, o modelbuilder lançou a função de dados de alta qualidade dos grandes modelos híbridos wenxin.os usuários podem integrar corpus misto geral e corpus de domínio vertical com dados de negócios para ajustar grandes modelos específicos do setor que sejam mais estáveis ​​e eficazes.

do ponto de vista do desenvolvimento de aplicativos nativos de ia, o appbuilder resolve muitos dos problemas que os clientes enfrentam ao desenvolver aplicativos nativos de ia - recuperação massiva de conhecimento, estratégias personalizadas, segurança de nível empresarial e outros aspectos foram aprimorados, tornando modelos grandes mais utilizáveis. nível. atualmente, mais de centenas de milhares de aplicativos foram criados na plataforma, abrangendo educação online, comércio eletrônico, assuntos governamentais e outros setores.

o grande sistema modelo do baidu realmente melhorou a produtividade do cliente, o que é óbvio para todos na indústria.

olhando para trás, o próprio baidu também possui um enorme ecossistema de produtos de tecnologia. se a capacidade de modelos grandes for realmente tão poderosa, o baidu, uma "árvore velha" de 24 anos, poderá produzir "novos brotos" novamente?

reconstrua o modelo do produto, veja o mundo e veja a si mesmo

há uma história amplamente divulgada na internet: no meio da segunda guerra mundial, a guerra foi um período de ansiedade, mas a qualidade dos pára-quedas militares dos eua era preocupante. para atingir uma taxa de aprovação de 100% dos pára-quedas, os militares vieram. encontre uma solução: deixe o próprio vendedor do pára-quedas testá-lo. se você não pular, não conseguirá passar. como resultado, a taxa de passagem do pára-quedas finalmente se aproximou de 100%.

“se você mesmo não usa um produto, como pode fazer com que os outros se sintam à vontade?”

o mesmo princípio se aplica ao baidu. já no ano passado, robin li fez uma declaração ousada de que usaria o modelo wenxin para reconstruir todos os produtos do baidu. o primeiro a suportar o peso é a base do baidu – a pesquisa.

atualmente, 18% dos resultados de pesquisa são gerados por ia, o que pode fornecer aos usuários resultados mais precisos e diretos. isso apenas confirma o conceito de “nova pesquisa” proposto pelo baidu há um ano, com as três características de “extrema satisfação”, “estimulação de recomendação” e “múltiplas rodadas de interação” para tornar os resultados de pesquisa dos usuários mais precisos, mais organizados e mais eficiente.

os agentes são uma parte fundamental disso. o baidu está acelerando a distribuição de agentes nos resultados de pesquisa atualmente, a distribuição média diária de agentes do baidu ultrapassou 800 milhões, o dobro de maio.

robin li enfatizou repetidamente que os agentes são como sites de ia, com limites baixos, mas tetos altos.

do ponto de vista do desenvolvimento, é mais fácil desenvolver um agente do que um site. robin li disse: “como era feito o site naquela época? poucas mudanças. farei isso hoje. o agente inteligente é muito parecido com este... dê um nome a ele, diga o que responder e o que não responder, e um agente inteligente é criado.

como um dos primeiros grandes fabricantes do setor, o baidu construiu um ecossistema que está começando a tomar forma no caminho dos agentes inteligentes. baidu wenxin intelligence platform agentbuilder acumulou 200.000 desenvolvedores e 63.000 empresas quando os desenvolvedores criam agentes na wenxin intelligence platform, eles podem escolher com flexibilidade as versões wenxin model 3.5 ou 4.0. todos os modelos podem ser usados ​​​​gratuitamente, o que pode ser considerado “nivelado. o limite” de uso.

com a abertura das olimpíadas de paris neste verão, os fãs de muitos atletas agiram. eles se reuniram espontaneamente na plataforma inteligente baidu wenxin e desenvolveram muitos corpos inteligentes de apoio aos fãs. fãs da tenista de mesa chinesa sun yingsha desenvolveram "sun yingsha's little fan girl" para ela; fãs que apoiam a tenista wang manyu desenvolveram "manyu's little taro ball" o corpo inteligente da mergulhadora quan hongchan por causa de seu popular charme de mochila, ela; foi chamada de “bolsa escolar de chanchan” por seus fãs. as trocas foram únicas e muito interessantes.

no campo agrícola, o acadêmico zhu youyong, da academia chinesa de engenharia, também ajudou o baidu na criação da "inteligência acadêmica do agricultor". este agente inteligente, equipado com os resultados da pesquisa de zhu youyong e sua equipe, pode responder a uma variedade de perguntas dos agricultores, incluindo o plantio de arroz de sequeiro de alta qualidade, batata de inverno e outras culturas, levando a tecnologia para beneficiar os agricultores a um novo nível.

o limite é baixo e o efeito é bom. como os agentes inteligentes podem não se tornar populares? não é difícil perceber que a escala dos futuros agentes inteligentes pode ser comparada ao vasto número de websites atuais, formando um enorme ecossistema.

a ambição do baidu é usar a pesquisa como a maior entrada para a distribuição de agentes inteligentes e estar na vanguarda da grande prosperidade dos agentes inteligentes.

entre os muitos produtos tradicionais do baidu, o baidu wenku é famoso por “marcar duas vezes”.

reconstruído pelo grande modelo em uma "plataforma completa de aquisição e criação de conteúdo de ia", o baidu wenku está mais à frente no caminho da ia, com centenas de ppt inteligentes, documentos inteligentes, mapas mentais inteligentes, relatórios de pesquisa inteligentes, etc. a função modal de ia melhora muito a experiência dos usuários com documentos e a eficiência de uso.

até agora, o número acumulado de usuários de ia do baidu wenku ultrapassou 180 milhões e o número de usos de funções de ia ultrapassou 2,2 bilhões, permitindo que mais pessoas aproveitem os dividendos de produtividade trazidos por modelos grandes, dando a este produto de 15 anos um "segunda primavera" ".

conclusão

este ano, robin li certa vez fez uma declaração de alto nível de que o foco dos grandes modelos ainda é a "aplicação de volume": "sem aplicativos, apenas os modelos básicos, sejam eles de código aberto ou fechado, são inúteis."

mas o que realmente pode ser visto é que o baidu precisa compreender tanto os modelos básicos quanto as aplicações, e ambas as mãos devem ser fortes.

nos últimos dez anos, o suor do baidu em grandes modelos e pesquisas básicas de ia finalmente nutriu um acre de solo fértil, mas o solo por si só não é suficiente, o baidu entrou no segundo estágio de desenvolvimento de grandes modelos, com foco na construção de aplicações nativas de ia - cultivando “colheitas” abundantes neste “solo fértil”.

a profunda integração da ia ​​generativa no negócio e a utilização resoluta de grandes modelos para reconstruir a pesquisa também aumentaram a confiança de muitas empresas de valores mobiliários no baidu.

jp morgan disse: "do ponto de vista comercial, tal mudança expandirá o papel do baidu na cadeia de valor, desde a pura orientação de tráfego até a consultoria pré-venda. acreditamos que esta última aumentará o fluxo de conversas sobre transações, se executada com sucesso, terá um impacto positivo nos lucros a médio e longo prazo.”

se outras grandes empresas quiserem implementar grandes modelos, elas podem realmente precisar aprender com o baidu: reduzir ao mínimo os limites de uso e custo, confiar na força da nuvem e nas cadeias de ferramentas para construir um ecossistema que funcione bem e confiar em grandes modelos e agentes para reconstruir os modelos de negócios existentes.

esses três movimentos são operações essenciais para promover grandes modelos para realmente “voarem para as casas das pessoas comuns”.