notícias

louco contra openai, zhipu ai tem que lutar até a morte

2024-09-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

escrito por |zhang yu

editor | yang yong

recentemente, o grande modelo de ia "unicórnio" zhipu ai concluiu uma nova rodada de financiamento liderada pela zhongguancun science city company com uma avaliação pré-financeira de 20 bilhões de yuans, com um montante de financiamento de vários bilhões de yuans. é relatado que esta rodada de financiamento é a terceira rodada de financiamento concluída pela zhipu ai desde 2024.

em junho de 2024, foi noticiado que o prosperity7, um fundo gerido pelo braço de capital de risco da gigante petrolífera do médio oriente saudi aramco, investiu na zhipu ai com um montante de investimento de 400 milhões de dólares. esta ronda de financiamento impulsionou directamente o desenvolvimento da zhipu. ai.a avaliação entrou no "clube dos 20 bilhões de yuans", e a avaliação de 20 bilhões de yuans também é geralmente considerada a base para entrar no primeiro escalão da indústria.

a partir de agora, a lista de acionistas da zhipu ai inclui instituições de investimento conhecidas, como hillhouse capital, qiming venture partners e sequoia capital, bem como gigantes da internet, como meituan strategic investment department, ant group, alibaba e tencent investment. além disso, existem ativos estatais, como o fundo zhongguancun para o fundo de segurança social, o fundo da indústria de inteligência artificial de pequim e a cidade científica de zhongguancun.

a zhipu ai foi fundada em junho de 2019. foi transformada a partir das conquistas técnicas do laboratório de engenharia de conhecimento (keg) da universidade de tsinghua. é atualmente a única grande empresa modelo totalmente de propriedade nacional e totalmente desenvolvida por conta própria na china. arquitetura de treinamento já em 2020. pesquisa e desenvolvimento e treinaram o modelo glm-10b de 10 bilhões de parâmetros em 2022, eles desenvolveram em conjunto o modelo geral de pré-treinamento de ultra grande escala de 130 bilhões de níveis glm-130b; zhipu ai lançou a série glm de 100 bilhões de modelos de diálogo de base de código aberto e, após lançar o glm-4 em janeiro de 2024, zhipu ai lançou o modelo de código aberto glm-4-9b em junho e lançou a ferramenta de geração de vídeo qingying em julho.

"alcançando o openai" e "benchmarking open ai são os objetivos da zhipu ai" são os slogans que o ceo da zhipu ai, zhang peng, mencionou muitas vezes ao compartilhar com o público. no entanto, a competição atual de grandes modelos não é mais de 0 a 1. .a batalha não é uma batalha, mas uma batalha pela implementação. com o apoio de muitas forças capitais, será que a zhipu ai, conhecida como "china openai", conseguirá avançar com sucesso na competição de modelos em grande escala?

1. openai ainda é líder

desde o estabelecimento da zhipu ai, o openai tem como objetivo recuperar o atraso. até agora, zhipu ai criou produtos modelo que são completamente comparados com openai, incluindo o assistente de melhoria de eficiência de ia zhipu qingyan, o modelo de código de alta eficiência codegeex, o modelo de compreensão multimodal cogvlm e o modelo de diagrama vincent cogview , etc.

no entanto, embora o zhipu ai seja conhecido como o maior modelo de código aberto da china, não é fácil fazer um benchmarking com o openai.

por exemplo, zhipu ai lançou um modelo de linguagem de nova geração glm-4 no primeiro technology open day (zhipu devday) realizado em janeiro de 2024. embora o desempenho geral do glm-4 tenha sido significativamente melhorado em 60% em comparação com a geração anterior, é conhecido como "comparável ao gpt-4", mas na verdade atinge apenas cerca de 90% do nível do gpt-4.

zhang peng também disse francamente que, em comparação com os grandes modelos estrangeiros, o desenvolvimento de grandes modelos nacionais começou mais tarde. juntamente com as limitações do poder de computação de alto desempenho e a lacuna na qualidade dos dados, os grandes modelos nacionais estão no mesmo nível do nível avançado do mundo. em termos de escala e capacidades essenciais, existe uma certa lacuna, que é de cerca de um ano.

em primeiro lugar, do ponto de vista técnico, a openai presta mais atenção à versatilidade, portabilidade e escalabilidade. os seus modelos da série gpt podem ser aplicados em múltiplos cenários e são altamente personalizáveis. em contraste, a rota técnica da zhipu ai é “modelo grande + modelo pequeno”, que se adapta às necessidades de diferentes cenários e tarefas através de pré-treinamento e ajuste fino de modelos grandes. esta rota técnica pode melhorar a capacidade de generalização do modelo e o escopo de aplicação. , mas também existem problemas como alta complexidade do modelo, grande quantidade de cálculos e longo tempo de treinamento.

em segundo lugar, os modelos da série gpt da openai são maiores em escala e podem lidar com grandes quantidades de dados de linguagem natural, alcançando assim um melhor desempenho do modelo. em contraste, o tamanho do modelo da zhipu ai pode ser menor e sua capacidade de processar dados é limitada, o que pode afetar o desempenho do modelo e as capacidades de generalização.

além disso, em termos de recursos de dados, openai possui uma grande quantidade de recursos de dados de linguagem natural que podem ser usados ​​para treinar e otimizar seu modelo, enquanto zhipu ai pode ter relativamente poucos recursos de dados, resultando em limitações no efeito e desempenho de seu treinamento de modelo.

a lacuna entre os dois lados é refletida de forma mais intuitiva no número de usuários. em novembro de 2022, o número de usuários do chatgpt da openai ultrapassou um milhão após apenas cinco dias online. em janeiro de 2023, seu número de usuários ativos mensais ultrapassou 100 milhões, tornando-o o aplicativo de consumo de crescimento mais rápido da história. em contraste, em novembro de 2023, o número de usuários ativos diários da zhipu qingyan, uma subsidiária da zhipu ai, variava de apenas 100.000 a 400.000.

na verdade, a lacuna entre zhipu ai e openai está ficando cada vez maior. em 13 de setembro, a openai lançou a série de modelos o1, incluindo a versão prévia o1 e o1-mini. em uma série de testes de benchmark, o1 mais uma vez mostrou uma grande melhoria em comparação com o gpt-4o, e foi até “comparável a especialistas humanos” em testes de benchmark em problemas de física, biologia e química.

por exemplo, na olimpíada internacional de matemática (imo), o gpt-4o obteve uma pontuação de 13,4% e o1 obteve uma pontuação de 83,3% na competição de programação codeforces, o1 obteve uma pontuação excelente de 89%, enquanto a precisão do gpt-4o; foi de apenas 11%. além disso, no teste gpqa-diamante, os especialistas humanos alcançaram uma precisão de 69,7, enquanto o1 alcançou uma precisão de 78%.

pode-se ver que a zhipu ai ainda está longe da openai. embora as conquistas da zhipu ai já sejam muito raras, diante do novo modelo da série o1 da openai, a zhipu ai sem dúvida precisa trabalhar mais.

2. a guerra de preços se intensifica

desde maio de 2024, a guerra de preços no campo dos grandes modelos já dura mais de quatro meses, fazendo com que cada vez mais grandes empresas de modelos se envolvam no vórtice da guerra de preços.

esta guerra de preços começou com a deepseek, uma empresa de ia de propriedade da gigante de private equity magic square quantitative. em 6 de maio, deepseek anunciou o grande modelo moe de segunda geração de código aberto deepseek-v2, com um preço de quase 1% de gpt-4-turbo e apenas 1 yuan por um milhão de tokens.

zhipu ai fez o mesmo em 11 de maio, zhipu ai anunciou que o preço de compra da versão pessoal do glm-3 turbo foi reduzido de 5 yuans/milhão de tokens para 1 yuan/milhão de tokens. no evento zhipu ai open day realizado em 5 de junho, a zhipu ai anunciou mais uma vez que o preço da matriz do modelo completo caiu. entre eles, o preço do glm-4-air e do glm-3-turbo foi reduzido para 0,6 yuan/milhão de tokens, o preço do modelo embedding-2 foi tão baixo quanto 0,3 yuan/milhão de tokens e o preço de o modelo glm-4-flash caiu para 0,06 yuans/milhão de tokens.

a bytedance também aderiu à guerra de preços, anunciando que o modelo principal do doubao (doubao universal model pro) custa 0,0008 yuan/mil tokens no mercado empresarial sob a bandeira de ser 99,3% inferior ao preço médio da indústria. mesmas especificações do mercado o preço é geralmente de 0,12 yuan/mil tokens, o que é 150 vezes o preço do modelo de bean bag.

desde então, alibaba, tencent, baidu e iflytek anunciaram reduções de preços para modelos grandes. por exemplo, o alibaba cloud reduziu o preço de entrada do qwen-long para 0,0005 yuans/mil tokens, e o preço de saída caiu 90% para 0,002 yuans/mil tokens. o baidu smart cloud anunciou dois modelos principais do wenxin large model, enire speed; ​e enire lite gratuito e aberto.

openai também é a principal força na guerra de preços. seu preço do gpt-4o foi reduzido novamente pela metade em comparação com o gpt-4-turbo. este é o quarto corte de preço da openai desde o início de 2023. de acordo com as expectativas da openai, os seus grandes modelos continuarão a ser reduzidos em 50%-75% todos os anos.

vale a pena mencionar que, embora se espere que o declínio contínuo nos preços dos grandes modelos leve a uma comercialização mais rápida, ao mesmo tempo, as guerras de preços muitas vezes significam que as grandes empresas de modelos precisam fazer concessões no preço. para a zhipu ai, a sua própria rentabilidade é. já limitados. se continuarmos a envolver-nos em guerras de preços, os lucros poderão cair ainda mais e será mais difícil alcançar a rentabilidade.

em contraste, a guerra de preços pode ter menos impacto na openai. afinal, já em dezembro de 2023, o ceo da openai, sam altman, revelou que a receita mensal atual da openai atingiu centenas de milhões de dólares, e a receita anualizada é muito alta. ultrapassar 1,5 bilhão. instituições terceirizadas também prevêem que a receita da openai em 2024 provavelmente mais que dobrará a de 2023, com estimativas otimistas atingindo us$ 5 bilhões.

é previsível que, devido à guerra de preços e à lacuna técnica, a zhipu ai possa não ter uma vida fácil em 2024. zhang peng também admitiu que os desafios enfrentados pela zhipu ai em 2024 serão muito difíceis: por um lado, a openai irá estará em super reconhecimento em 2024. a tecnologia em conhecimento e super alinhamento alcançará novos avanços, o que exige que a zhipu ai itere continuamente a tecnologia e siga os passos dos líderes mundiais, por outro lado, grandes modelos darão início a uma onda de comercialização em 2024; , e a comercialização de zhipu ai a pressão competitiva também aumentará.

3. acelerar o investimento ecológico

o layout do produto e o layout do investimento são as duas linhas principais para a zhipu ai alcançar a comercialização.

zhang peng certa vez explicou publicamente as ideias de investimento da zhipu ai: “esperamos criar um grande ecossistema modelo, no qual trabalharemos lado a lado com nossos parceiros para tornar o ecossistema cada vez maior. sobre a visão de negócios para 2024, zhang peng disse: "é nossa importante tarefa tornar o grande modelo verdadeiramente prático e fundamentado."

em 2024, a zhipu ai lançará um fundo de código aberto de grande modelo de código aberto. o plano inclui três "1000": zhipu ai fornecerá 1.000 cartões de computação para a comunidade de código aberto de grande modelo para ajudar no desenvolvimento de código aberto, fornecendo 10 milhões de yuans em dinheiro; usado para apoiar projetos de código aberto relacionados a grandes modelos; fornecer 100 bilhões de tokens de api gratuitos para excelentes desenvolvedores de código aberto. zhang peng disse que o objetivo do fundo de código aberto para grandes modelos é promover grande progresso na pesquisa e desenvolvimento de grandes modelos e promover a prosperidade de todo o ecossistema de código aberto de grandes modelos.

diante dos grandes empreendedores globais de modelos, a zhipu ai atualizará o "plano z" e lançará um grande fundo empresarial de modelos totalizando 1 bilhão de yuans com parceiros ecológicos para apoiar a inovação original de grandes modelos, abrangendo algoritmos de grandes modelos, operadores subjacentes e otimização de chips, grandes modelos da indústria e super aplicações.

em agosto de 2024, no evento do dia do roadshow corporativo zhipu ai "z plan", zhang peng anunciou oficialmente que zhipu ai e parceiros ecológicos lançarão o fundo ecológico agi: fundo z para apoiar mais projetos em estágio inicial com potencial em modelo de grande escala faixas. em 3 de setembro, o fabricante de robôs humanóides dongyi technology concluiu dezenas de milhões de yuans em financiamento da rodada anjo. o principal investidor foi o z fund. até agora, a zhipu ai investiu na empresa de camada de modelo de ia "lingxin intelligence", no provedor de produtos de serviços jurídicos inteligentes "power law intelligence", no provedor de serviços de software e tecnologia da informação "sudao intelligence" e no provedor de aplicativos de ia generativos "shengshu technology" e outras 11 empresas.

objetivamente falando, quando as instalações de apoio à cadeia industrial são insuficientes, investir em toda a cadeia industrial é uma forma de quebrar a situação, mas a forma mais crítica de quebrar a situação reside em como criar produtos que expandam a imaginação dos utilizadores e como transformar esses produtos em produtividade. esta será a próxima pergunta obrigatória para a zhipu ai.