noticias

alibaba cloud vuelve a bajar los precios, ¿por qué los grandes modelos todavía no tienen prisa por "saldar cuentas"?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"gratis" y "reducción de precios"... el 19 de septiembre, en la conferencia yunqi de 2024, alibaba cloud lanzó una serie de productos y anunció una nueva ronda de reducciones de precios "alibaba cloud trabajará duro para continuar reduciendo costos". así lo dijo el director ejecutivo de alibaba group, presidente y director ejecutivo de alibaba cloud intelligence group, wu yongming.
detrás de esto, para los proveedores de nube, la industria aún se encuentra en las primeras etapas de la revolución agi, y la "ola de reducción de precios" de los modelos grandes no muestra signos de terminar.
"en el último período, el costo de la inferencia del modelo se redujo exponencialmente, superando con creces la ley de moore. el año pasado, el precio de llamada de la api tongyi qianwen en alibaba cloud bailian se redujo en un 97% y el costo de la llamada de un millón de tokens. ha caído a los 5 centavos más bajos", reveló wu yongming en su discurso en la mañana del 19 de septiembre.
en la tarde del mismo día, el costo mínimo de llamada de alibaba cloud qwen-turbo por un millón de tokens se actualizó nuevamente a 30 centavos, zhou jingren, director de tecnología de alibaba cloud intelligence group, anunció que el precio de qwen-turbo. cayeron un 85%, los precios de qwen-plus y qwen-max se redujeron en un 80% y 50% respectivamente, y alibaba cloud inició una nueva ronda de recortes de precios.
al mismo tiempo, alibaba cloud también lanzó una nueva generación del modelo de código abierto qwen2.5. su modelo de lenguaje visual qwen2-vl-72b también es oficialmente de código abierto. puede reconocer imágenes de diferentes resoluciones y relaciones de aspecto y comprender videos de más larga duración. 20 minutos. el modelo insignia de alibaba cloud tongyi, qwen-max, también recibió una actualización completa. zhou jingren dijo que su rendimiento es cercano al gpt-4o. los modelos de fondo del sitio web oficial de tongyi y la aplicación tongyi se han cambiado a qwen-max ". para proporcionar servicios gratuitos a todos los usuarios." prestación de servicios". además, zhou jingren también anunció una actualización integral de tongyi wanxiang y lanzó un nuevo modelo de generación de video. esta herramienta de producción de video con ia es completamente gratuita y "la aplicación está abierta para uso ilimitado todos los días".
detrás de la serie de acciones de alibaba cloud, un fenómeno es que pagar dinero para atraer tráfico y atraer nuevos clientes sigue siendo la norma en la industria de los grandes modelos.
"el código abierto y la reducción de precios se basan en la misma lógica: cómo desarrollar el ecosistema", dijo zhou jingren en una entrevista con los periodistas. dijo que desde el año pasado, alibaba cloud ha estado firmemente comprometida con el código abierto. en el último año, alibaba cloud ha visto la construcción ecológica de modelos funcionar más allá de las expectativas y los modelos grandes ya no son superiores. a mediados de septiembre de 2024, las descargas acumuladas del modelo de código abierto tongyi qianwen superaron los 40 millones.
zhou jingren dijo que cada reducción de precio de alibaba cloud ha pasado por discusiones internas muy serias. además del costo, los proveedores de la nube deben sopesar el desarrollo de toda la industria, la retroalimentación de los desarrolladores y los usuarios empresariales, y lograr mayores reducciones en los costos futuros a través de economías de escala, progreso tecnológico y programación de recursos. desde una perspectiva de desarrollo a largo plazo, las capacidades de los modelos grandes deben ser asequibles para todos, estimulando así una mayor innovación a nivel industrial. wu yongming también dijo en su discurso que el costo de la inferencia del modelo es una cuestión clave que afecta la explosión de aplicaciones.
"hay un dicho que dice que la ia actual equivale a internet alrededor de 1996, es decir, en la era bbs, las tarifas de acceso a internet eran muy caras en ese momento. más tarde, con el desarrollo de internet, incluido el desarrollo de internet móvil, los operadores invirtieron vigorosamente en la construcción de infraestructura y las tasas de tráfico cayeron ". zhang qi, vicepresidente de alibaba cloud, dijo que alibaba cloud también está construyendo frenéticamente infraestructura de inteligencia artificial. sólo reduciendo las tarifas podemos discutir la explosión de aplicaciones futuras. el objetivo a largo plazo es lo que alibaba cloud considera más. la pregunta es: "en lugar de decir que debemos calcular una cuenta hoy y cuánto dinero podemos ganar de inmediato".
dado que la reducción de precios de los modelos grandes erosiona la utilidad bruta o incluso la utilidad bruta negativa, ¿cuál es el resultado final de la reducción de precios de los modelos grandes? en este sentido, zhou jingren dijo que la reducción de precios de alibaba cloud se debe principalmente a la optimización de la tecnología. no solo la iteración rápida del modelo en sí, sino también la eficiencia de inferencia del modelo y la optimización estructural se llevan a cabo simultáneamente para promover una mayor reducción del modelo. costos de inferencia. alibaba cloud debemos transferir los dividendos de la tecnología a los clientes corporativos para promover el desarrollo de toda la industria.
"también somos conscientes de que la aplicación de los modelos actuales, incluidas varias innovaciones en los modelos, aún se encuentra en sus primeras etapas. en este momento, si ponemos el razonamiento del modelo en una etapa costosa, una gran cantidad de desarrolladores no podrán para ser eficaz, usarlo en lotes o a gran escala también afectará la atención de todos (a la reforma agi) hasta cierto punto”, dijo zhou jingren.
(este artículo proviene de china business news)
informe/comentarios