notícias

alibaba cloud reduz os preços novamente, por que as grandes modelos ainda não têm pressa em “acertar contas”?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"grátis" e "redução de preço"... em 19 de setembro, na conferência yunqi de 2024, o alibaba cloud lançou uma série de produtos e anunciou uma nova rodada de reduções de preços "o alibaba cloud trabalhará duro para continuar a reduzir custos." o ceo do alibaba group, presidente e ceo do alibaba cloud intelligence group, wu yongming, disse isso.
por trás disso, para os fornecedores de nuvem, a indústria ainda está nos estágios iniciais da revolução agi, e a “onda de redução de preços” de grandes modelos não dá sinais de acabar.
"no período passado, o custo da inferência do modelo caiu exponencialmente, excedendo em muito a lei de moore. no ano passado, o preço da chamada da api tongyi qianwen no alibaba cloud bailian caiu 97%, e o custo da chamada para um milhão de tokens caiu para os 5 centavos mais baixos." wu yongming revelou em seu discurso na manhã de 19 de setembro.
na tarde do mesmo dia, o custo mínimo da chamada do alibaba cloud qwen-turbo para um milhão de tokens foi mais uma vez atualizado para 30 centavos, zhou jingren, diretor de tecnologia do alibaba cloud intelligence group, anunciou que o preço do qwen-turbo. caíram 85%, os preços do qwen-plus e qwen -max foram reduzidos em 80% e 50%, respectivamente, e o alibaba cloud iniciou uma nova rodada de cortes de preços.
ao mesmo tempo, o alibaba cloud também lançou uma nova geração do modelo de código aberto qwen2.5. seu modelo de linguagem visual qwen2-vl-72b também é oficialmente de código aberto. ele pode reconhecer imagens de diferentes resoluções e proporções e compreender vídeos por mais tempo. 20 minutos. o modelo carro-chefe do alibaba cloud tongyi, qwen-max, também recebeu uma atualização completa. zhou jingren disse que seu desempenho está próximo do gpt-4o. os modelos de fundo do site oficial de tongyi e do app tongyi foram mudados para qwen-max. ser gratuito para todos os usuários." prestação de serviços". além disso, zhou jingren também anunciou uma atualização abrangente do tongyi wanxiang e lançou um novo modelo de geração de vídeo. esta ferramenta de produção de vídeo ai é totalmente gratuita e "o app está aberto para uso ilimitado todos os dias".
por trás da série de ações do alibaba cloud, um fenômeno é que pagar para atrair tráfego e atrair novos clientes ainda é a norma na grande indústria de modelos.
"o código aberto e a redução de preços baseiam-se na mesma lógica, como desenvolver o ecossistema.", disse zhou jingren em entrevista a repórteres. ele disse que desde o ano passado, o alibaba cloud está firmemente comprometido com o código aberto. no ano passado, o alibaba cloud viu a construção ecológica de modelos funcionar além das expectativas, e os modelos grandes não são mais superiores. em meados de setembro de 2024, os downloads cumulativos do modelo de código aberto tongyi qianwen ultrapassaram 40 milhões.
zhou jingren disse que cada redução de preço do alibaba cloud passou por discussões internas muito sérias. além do custo, os fornecedores de nuvem devem avaliar o desenvolvimento de todo o setor, o feedback dos desenvolvedores e dos usuários corporativos, e obter reduções adicionais nos custos futuros por meio de economias de escala, progresso tecnológico e agendamento de recursos. numa perspectiva de desenvolvimento a longo prazo, as capacidades dos grandes modelos têm de ser acessíveis a todos, estimulando assim mais inovação a nível industrial. wu yongming também disse em seu discurso que o custo de inferência do modelo é uma questão fundamental que afeta a explosão de aplicações.
“há um ditado que diz que a ia de hoje equivale à internet por volta de 1996, ou seja, na era bbs, as taxas de acesso à internet eram muito caras naquela época. as operadoras investiram vigorosamente na construção de infraestrutura e as taxas de tráfego caíram. zhang qi, vice-presidente da alibaba cloud, disse que a alibaba cloud também está construindo freneticamente a infraestrutura de ia. somente reduzindo as tarifas podemos discutir a explosão de aplicações futuras. objetivo de longo prazo é o que o alibaba cloud considera mais. a questão é: "em vez de dizer que devemos calcular uma conta hoje e quanto dinheiro podemos ganhar imediatamente."
à medida que a redução de preços dos grandes modelos corrói o lucro bruto ou mesmo o lucro bruto negativo, qual é o resultado final da redução de preços dos grandes modelos? a este respeito, zhou jingren disse que a redução de preços do alibaba cloud se dá principalmente através da otimização da tecnologia. não apenas a rápida iteração do modelo em si, mas também a eficiência de inferência do modelo e a otimização estrutural também são realizadas simultaneamente para promover maior redução do modelo. custos de inferência. alibaba cloud devemos transferir os dividendos da tecnologia para clientes corporativos para promover o desenvolvimento de toda a indústria.
“também percebemos que a aplicação dos modelos atuais, incluindo diversas inovações em modelos, ainda está em seus estágios iniciais. neste momento, se colocarmos a inferência do modelo em um estágio caro, um grande número de desenvolvedores não será capaz para ser eficaz, usá-lo em lotes ou em grande escala também afetará a atenção de todos (à reforma da agi) até certo ponto”, disse zhou jingren.
(este artigo vem do china business news)
relatório/comentários