nouvelles

alibaba cloud baisse encore les prix, pourquoi les grands modèles ne sont-ils toujours pas pressés de « régler leurs comptes » ?

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"gratuit" et "réduction de prix"... le 19 septembre, lors de la conférence yunqi 2024, alibaba cloud a lancé un certain nombre de produits et a annoncé une nouvelle série de réductions de prix "alibaba cloud travaillera dur pour continuer à réduire les coûts". wu yongming, pdg du groupe alibaba, président-directeur général d'alibaba cloud intelligence group, l'a déclaré.
derrière cela, pour les fournisseurs de cloud, le secteur en est encore aux premiers stades de la révolution agi, et la « vague de réduction des prix » des grands modèles ne montre aucun signe de fin.
« au cours de la période écoulée, le coût de l'inférence de modèle a chuté de façon exponentielle, dépassant largement la loi de moore. au cours de l'année écoulée, le prix d'appel de l'api tongyi qianwen sur alibaba cloud bailian a chuté de 97 %, et le coût d'appel d'un million de jetons. est tombé aux 5 cents les plus bas", a révélé wu yongming dans son discours du matin du 19 septembre.
dans l'après-midi du même jour, le coût minimum d'appel d'alibaba cloud qwen-turbo pour un million de jetons a de nouveau été ramené à 30 cents. zhou jingren, directeur de la technologie d'alibaba cloud intelligence group, a annoncé que le prix de qwen-turbo. a chuté de 85 %, les prix qwen-plus et qwen -max ont été réduits respectivement de 80 % et 50 %, et alibaba cloud a lancé une nouvelle série de baisses de prix.
dans le même temps, alibaba cloud a également publié une nouvelle génération de modèle open source qwen2.5. son modèle de langage visuel qwen2-vl-72b est également officiellement open source. il peut reconnaître des images de différentes résolutions et formats d'image et comprendre des vidéos plus longues. 20 minutes. le modèle phare d'alibaba cloud tongyi, qwen-max, a également reçu une mise à niveau complète. zhou jingren a déclaré que ses performances sont proches de gpt-4o. les modèles d'arrière-plan du site officiel de tongyi et de l'application tongyi ont été basculés vers qwen-max. être gratuit pour tous les utilisateurs. "fournir des services". en outre, zhou jingren a également annoncé une mise à niveau complète de tongyi wanxiang et a publié un nouveau modèle de génération vidéo. cet outil de production vidéo ia est entièrement gratuit et « l'app est ouverte pour une utilisation illimitée tous les jours ».
derrière la série d'actions d'alibaba cloud, un phénomène est que payer de l'argent pour attirer du trafic et attirer de nouveaux clients reste la norme dans la grande industrie du mannequinat.
"l'open source et la réduction des prix reposent tous sur la même logique, à savoir comment développer l'écosystème, a déclaré zhou jingren dans une interview à la presse." il a déclaré que depuis l'année dernière, alibaba cloud s'est fermement engagé dans l'open source. au cours de l'année écoulée, alibaba cloud a vu la construction écologique de modèles fonctionner au-delà des attentes et les grands modèles ne sont plus supérieurs. à la mi-septembre 2024, les téléchargements cumulés du modèle open source tongyi qianwen dépassaient les 40 millions.
zhou jingren a déclaré que chaque réduction de prix d'alibaba cloud avait fait l'objet de discussions internes très sérieuses. outre les coûts, les fournisseurs de cloud doivent tenir compte du développement de l'ensemble du secteur, des retours des développeurs et des utilisateurs de l'entreprise, et parvenir à de nouvelles réductions des coûts futurs grâce à des économies d'échelle, aux progrès technologiques et à la planification des ressources. dans une perspective de développement à long terme, les capacités des grands modèles doivent être abordables pour tous, stimulant ainsi davantage l’innovation au niveau industriel. wu yongming a également déclaré dans son discours que le coût d'inférence du modèle est un problème clé affectant l'explosion des applications.
"il y a un dicton selon lequel l'ia d'aujourd'hui est équivalente à l'internet vers 1996, c'est-à-dire qu'à l'époque du bbs, les tarifs d'accès à internet étaient très chers. plus tard, avec le développement d'internet, y compris le développement de l'internet mobile, les opérateurs ont vigoureusement investi dans la construction d'infrastructures et les taux de trafic ont chuté. zhang qi, vice-président d'alibaba cloud, a déclaré qu'alibaba construisait également frénétiquement des infrastructures d'ia. ce n'est qu'en baissant les tarifs que nous pourrons discuter de l'explosion des applications futures. l'objectif à long terme est ce qu'alibaba cloud considère davantage. la question est : « plutôt que de dire que nous devons calculer un compte aujourd'hui et combien d'argent nous pouvons gagner immédiatement ».
étant donné que la réduction des prix des grands modèles érode le bénéfice brut, voire le bénéfice brut négatif, quel est le résultat final de la réduction des prix des grands modèles ? à cet égard, zhou jingren a déclaré que la réduction des prix d'alibaba cloud passe principalement par l'optimisation de la technologie. non seulement l'itération rapide du modèle lui-même, mais également l'efficacité d'inférence et l'optimisation structurelle du modèle sont également effectuées simultanément pour promouvoir une réduction supplémentaire du modèle. coûts d'inférence. alibaba cloud nous devons transférer les dividendes de la technologie aux entreprises clientes pour promouvoir le développement de l'ensemble de l'industrie.
"nous sommes également conscients que l'application des modèles actuels, y compris diverses innovations dans les modèles, en est encore à ses débuts. à l'heure actuelle, si nous plaçons l'inférence du modèle dans une phase coûteuse, un grand nombre de développeurs ne pourront pas "pour être efficace, son utilisation par lots ou à grande échelle affectera également dans une certaine mesure l'attention de tous (sur la réforme de l'agi)", a déclaré zhou jingren.
(cet article provient de china business news)
rapport/commentaires