noticias

"Price Butcher" DeepSeek lanza otra gran guerra de precios de modelos. ¿Alguien hará un seguimiento esta vez?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Reportero de noticias de Jiemian |

Editor de noticias de la interfaz |

DeepSeek, el gran modelo “carnicero de precios”, lanzó una vez más un gran recorte de precios.

Recientemente, la compañía anunció que su tarifa de entrada API se ajustará a 0,1 yuanes/millón de tokens y la tarifa de salida será de 2 yuanes/millón de tokens. Esto significa que el precio de las API de modelos grandes se reducirá en otro orden de magnitud.

Al investigar el motivo de la reducción de precio, DeepSeek explicó que en los escenarios de uso de API de modelos grandes, una proporción considerable de las entradas de los usuarios se repiten. Por ejemplo, las palabras solicitadas por el usuario a menudo tienen algunas partes que se citan repetidamente, o en múltiples rondas de diálogo, el contenido de las rondas anteriores debe ingresarse repetidamente en cada ronda.

En respuesta a los problemas anteriores, DeepSeek habilita una solución que utiliza tecnología de almacenamiento en caché de disco duro contextual para almacenar en caché el contenido que se espera que se reutilice en el futuro en una matriz de disco duro distribuido. Si hay duplicados en la entrada, las partes duplicadas solo necesitan leerse del caché sin realizar cálculos. Ésta es también la razón de la reducción de precio de los modelos grandes esta vez.

DeepSeek señaló que la tecnología de almacenamiento en caché del disco duro contextual no solo puede reducir la latencia del servicio, sino también reducir significativamente los costos de uso final.

DeepSeek es también el primer gran fabricante de modelos del mundo que utiliza el almacenamiento en caché del disco duro a gran escala en servicios API. Esto se debe principalmente a la estructura MLA propuesta por DeepSeekV2: si bien mejora el efecto del modelo, comprime en gran medida el tamaño del contexto KVCache, lo que reduce en gran medida el ancho de banda de transmisión y la capacidad de almacenamiento requerida para el almacenamiento, por lo que se puede almacenar en caché de bajo costo. discos duros.

Además, el servicio DeepSeekAPI está diseñado con una capacidad diaria de 1 billón y no hay límites actuales o de concurrencia para los usuarios.

Esta no es la primera vez que la empresa reduce los precios. Desde mayo de este año, el disruptor DeepSeek ha tomado la iniciativa al lanzar una guerra de precios de API.

Ya el 25 de abril, DeepSeek fijó el precio de la API en 1 yuan/millón de tokens de entrada y 2 yuanes/millón de tokens de salida. El 6 de mayo, DeepSeek lanzó el código abierto.Ministerio de EducaciónEl modelo tiene parámetros más bajos y capacidades más fuertes. La API se reduce a 1 yuan/millón de tokens de entrada y 2 yuanes/millón de tokens de salida.GPT Una centésima de 4 Turbo.

Este recorte de precios provocó rápidamente respuestas de toda la industria: Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud, etc. anunciaron recortes de precios uno tras otro.

Entre ellos, Alibaba Cloud anunció que el modelo central Qwen-Long de Tongyi Qianwen ha caído un 97% y el precio después de la reducción es de solo 0,0005 yuanes/mil tokens. Baidu y Tencent han anunciado sucesivamente que algunos modelos grandes son gratuitos.

Y en el extranjero,IA abiertaDespués del lanzamiento de GPT 4o, se anunció que su uso sería gratuito y que el precio de la llamada API se reduciría a la mitad.

Vale la pena señalar que en un evento de Volcano Engine el 15 de mayo, Tan Dai, presidente de Volcano Engine, anunció que el precio del modelo universal de puf pro-32k es de solo 0,0008 yuanes/mil tokens. Las mismas especificaciones en el mercado son generalmente de 0,12 yuanes/Miles de tokens son 150 veces el precio del modelo de puf. El precio de los modelos de puf es un 99,3% más barato que el de la industria, lo que lleva el precio de los modelos grandes a la "era centi".

Tan Dai señaló que la reducción de costos es uno de los factores clave que promueven que los modelos grandes avancen a la "etapa de creación de valor". El precio de los rollos de modelos grandes ayudará a las empresas a acelerar la innovación empresarial a costos más bajos.

En ese momento, un experto de Volcano Engine le dijo a Jiemian News: "La verdadera razón de la reducción de precio de los modelos grandes de Doubao es que la aplicación de modelos grandes en el lado empresarial aún no se ha desarrollado y hay muy pocos escenarios". Señaló que aunque la industria está discutiendo el uso de modelos grandes de IA para reconstruir el negocio, en el trabajo y la vida diaria, es raro sentir que la implementación de capacidades de modelos grandes "la reducción de precios esencialmente reduce el umbral de uso".

Desde la perspectiva de la reducción, la reducción del precio de los insumos es generalmente mayor que la reducción del precio de la producción. La mayoría de los productos de precio reducido son versiones de modelos livianos, que solo son adecuados para uso a corto plazo por parte de pequeñas y medianas empresas y desarrolladores individuales con baja frecuencia, poco razonamiento y tareas simples.

En general, los modelos grandes todavía se encuentran en la etapa de cultivo en el mercado. En la actualidad, la reducción de precios de API es más una estrategia de adquisición de clientes para los grandes fabricantes de modelos para permitir que más empresas accedan a sus propios escenarios comerciales, promover la aplicación de modelos grandes en diversas industrias y acelerar aún más la comercialización. Esta iniciativa ayuda a atraer desarrolladores y socios, establece rápidamente un ecosistema y también proporciona un espacio más amplio para aplicaciones innovadoras en diversos campos.

Reducir los precios o hacerlos gratuitos es permitir que más empresas y desarrolladores utilicen rápidamente modelos grandes. Después de todo, permitir que más personas participen es un requisito previo para el desarrollo de la industria.

Sin embargo, es obviamente difícil completar el ciclo cerrado de la comercialización de modelos grandes confiando únicamente en el negocio API. "Ninguna gran empresa modelo sobrevive vendiendo API", dijo a Jiemian News un FA (consultor financiero) que anteriormente prestó atención a la gran industria modelo.

Fu Sheng, presidente y director ejecutivo de Cheetah Mobile, también cree que los grandes recortes de precios básicamente declaran que las nuevas empresas a gran escala deben encontrar nuevos modelos de negocio. Las que han sufrido las caídas más graves son las grandes empresas con servicios en la nube, que utilizan modelos grandes para conseguir clientes en la nube. "La lana viene del cerdo, por lo que puedes permitirte la reducción". ecosistema y debe encontrar otro modelo de negocio.

A diferencia de la primera ronda de recortes de precios, ante la guerra de precios iniciada por DeepSeek, muchas grandes empresas de modelos aún no han hecho un seguimiento y pocas han hecho comentarios relevantes. Sin embargo, otra reducción de precios muestra que se acerca la era inclusiva de los modelos grandes y se espera que el ecosistema de aplicaciones verticales florezca aún más.