notícias

"Price Butcher" DeepSeek lança outra grande guerra de preços de modelos. Alguém acompanhará desta vez?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Repórter de notícias Jiemian |

Editor de notícias da interface | Song Jianan

DeepSeek, o grande modelo “açougueiro de preços”, mais uma vez lançou um grande corte de preços.

Recentemente, a empresa anunciou que sua taxa de entrada de API será ajustada para 0,1 yuan/milhão de tokens e a taxa de saída será de 2 yuan/milhão de tokens. Isso significa que o preço de APIs de grandes modelos será reduzido em outra ordem de grandeza.

Investigando o motivo da redução de preço, DeepSeek explicou que nos cenários de uso de APIs de grandes modelos, uma proporção considerável de entradas do usuário é repetida. Por exemplo, as palavras de alerta do usuário geralmente têm algumas partes que são citadas repetidamente ou, em várias rodadas de diálogo, o conteúdo das rodadas anteriores deve ser inserido repetidamente em cada rodada.

Em resposta aos problemas acima, DeepSeek permite uma solução usando tecnologia de cache de disco rígido contextual para armazenar em cache o conteúdo que deverá ser reutilizado no futuro em uma matriz de disco rígido distribuída. Se houver duplicatas na entrada, as partes duplicadas só precisam ser lidas no cache sem cálculo. Este também é o motivo da redução de preços dos modelos grandes desta vez.

DeepSeek apontou que a tecnologia de cache contextual do disco rígido pode não apenas reduzir a latência do serviço, mas também reduzir significativamente os custos finais de uso.

A DeepSeek também é o primeiro grande fabricante de modelos do mundo a usar cache de disco rígido em larga escala em serviços API. Isso se deve principalmente à estrutura MLA proposta pelo DeepSeekV2 - ao mesmo tempo que melhora o efeito do modelo, ele comprime bastante o tamanho do KVCache de contexto, o que reduz bastante a largura de banda de transmissão e a capacidade de armazenamento necessária para armazenamento, para que possa ser armazenado em cache de baixo custo discos rígidos.

Além disso, o serviço DeepSeekAPI foi projetado com capacidade diária de 1 trilhão e não há limites atuais ou de simultaneidade para usuários.

Esta não é a primeira vez que a empresa reduz os preços. Desde maio deste ano, o disruptor DeepSeek assumiu a liderança no lançamento de uma guerra de preços de APIs.

Já em 25 de abril, o DeepSeek fixou o preço da API em 1 yuan/milhão de tokens de entrada e 2 yuan/milhão de tokens de saída. Em 6 de maio, DeepSeek lançou código abertoMoEO modelo tem parâmetros mais baixos e recursos mais fortes. A API é reduzida para 1 yuan/milhão de tokens de entrada e 2 yuan/milhão de tokens de saída.GPT Um centésimo de 4 Turbo.

Este corte de preços desencadeou rapidamente respostas de toda a indústria, com Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud, etc., anunciando cortes de preços um após o outro.

Entre eles, o Alibaba Cloud anunciou que o modelo principal Qwen-Long de Tongyi Qianwen caiu 97%, e o preço após a redução é de apenas 0,0005 yuan/mil tokens. Baidu e Tencent anunciaram sucessivamente que alguns modelos grandes são gratuitos.

E no exterior,IA abertaApós o lançamento do GPT 4o, foi anunciado que seu uso seria gratuito e o preço da chamada de API seria reduzido pela metade.

É importante notar que em um evento da Volcano Engine em 15 de maio, Tan Dai, presidente da Volcano Engine, anunciou que o preço do modelo universal de bean bag pró-32k é de apenas 0,0008 yuan/mil tokens. as mesmas especificações no mercado são geralmente 0,12 yuan/ Milhares de tokens custam 150 vezes o preço do modelo de bean bag. O preço dos modelos de pufes é 99,3% mais barato que o da indústria, levando o preço dos modelos grandes para a “era centi”.

Tan Dai destacou que a redução de custos é um dos fatores-chave na promoção de grandes modelos para avançar para o "estágio de criação de valor". O preço dos rolos de modelos grandes ajudará as empresas a acelerar a inovação empresarial a custos mais baixos.

Naquela época, um membro da Volcano Engine disse ao Jiemian News: “A verdadeira razão para a redução de preços dos grandes modelos Doubao é que a aplicação de grandes modelos no lado empresarial ainda não foi desenvolvida e há poucos cenários. apontou que, embora a indústria esteja discutindo o uso de grandes modelos de IA para reconstruir os negócios, mas no trabalho diário e na vida, é raro sentir a implementação de grandes capacidades de modelos “A redução de preços essencialmente reduz o limite de uso”.

Do ponto de vista da redução, a redução do preço dos factores de produção é geralmente superior à redução do preço da produção. A maioria dos produtos de preço reduzido são versões de modelos leves, adequadas apenas para uso de curto prazo por pequenas e médias empresas e desenvolvedores individuais com baixa frequência, pequena quantidade de raciocínio e tarefas simples.

No geral, os grandes modelos ainda estão em fase de cultivo no mercado. Actualmente, a redução do preço da API é mais uma estratégia de aquisição de clientes para grandes fabricantes de modelos, para permitir que mais empresas tenham acesso aos seus próprios cenários de negócios, promover a aplicação de grandes modelos em vários setores e acelerar ainda mais a comercialização. Esta iniciativa ajuda a atrair desenvolvedores e parceiros, estabelece rapidamente um ecossistema e também oferece um espaço mais amplo para aplicações inovadoras em diversos campos.

Reduzir os preços ou torná-los gratuitos é permitir que mais empresas e desenvolvedores utilizem rapidamente modelos grandes. Afinal, permitir a participação de mais pessoas é um pré-requisito para o desenvolvimento da indústria.

No entanto, é obviamente difícil completar o ciclo fechado de comercialização de grandes modelos confiando apenas no negócio de API. “Nenhuma grande empresa modelo sobrevive vendendo APIs.” Um FA (consultor financeiro) que anteriormente prestou atenção à grande indústria de modelos disse ao Jiemian News.

Fu Sheng, presidente e CEO da Cheetah Mobile, também acredita que grandes reduções de preços basicamente declaram que as startups de grande escala devem encontrar novos modelos de negócios. Aqueles que sofreram as quedas mais severas são as grandes empresas com serviços em nuvem, que usam grandes modelos para adquirir clientes em nuvem “A lã vem do porco, então você pode arcar com a redução, mas as grandes startups de modelos não têm essa redução”. ecossistema e deve encontrar outro modelo de negócios.

Ao contrário da primeira rodada de cortes de preços, face à guerra de preços iniciada pela DeepSeek, muitas grandes empresas modelo ainda não deram seguimento e poucas fizeram comentários relevantes. No entanto, outra redução de preços mostra que a era inclusiva dos grandes modelos está a chegar e que o ecossistema de aplicações verticais deverá florescer ainda mais.