zhou jingren : investir pleinement dans la mise à niveau de l'infrastructure de l'ia

2024-09-19

le 19 septembre, lors de la conférence hangzhou yunqi 2024, zhou jingren, directeur technique d'alibaba cloud, a déclaré qu'alibaba cloud établissait une nouvelle norme pour l'infrastructure d'ia autour de l'ère de l'ia, en mettant à niveau complètement tout, des serveurs à l'informatique, au stockage, au réseau, au traitement des données, et des modèles. l'architecture technique de la plateforme de formation et d'inférence transforme le centre de données en un superordinateur, fournissant des services informatiques performants et efficaces pour chaque ia et application.

sur le site de la conférence, tongyi large model a inauguré sa version majeure annuelle. le modèle de base a été mis à niveau avec des performances comparables à celles du gpt-4o. la série de modèles open source qwen2.5 a été publiée. plus de 100 modèles entièrement modaux comprenant la langue, l'audio et la vision ont été lancés en même temps. les téléchargements de modèles open source tongyi ont dépassé les 40 millions et les modèles natifs tongyi ont été lancés. le nombre total de modèles et de modèles dérivés dépasse 50 000, ce qui en fait un groupe de modèles de classe mondiale, juste derrière llama aux états-unis.

construisez une infrastructure d’ia puissante

contrairement à l'ère informatique traditionnelle, l'ère de l'ia a des exigences plus élevées en matière de performances et d'efficacité de l'infrastructure. le système informatique dominé par le cpu est rapidement passé au système informatique ia dominé par le gpu. alibaba cloud prend l'ia au centre, reconstruit entièrement le matériel, l'informatique, le stockage, le réseau, la base de données et le big data sous-jacents, et s'adapte et s'intègre de manière organique aux scénarios d'ia pour accélérer le développement et l'application des modèles et créer une infrastructure d'ia puissante. à l'ère de l'ia.

zhou jingren a déclaré : « les fournisseurs de cloud disposent de réserves technologiques complètes, et grâce à des mises à niveau complètes de l'infrastructure, l'ensemble du cycle de vie de la formation, de l'inférence, du déploiement et de l'application de l'ia est devenu plus efficace.

lors de la conférence, zhou jingren a présenté la mise à niveau basée sur l'ia de l'ensemble de la famille de produits alibaba cloud. le serveur panjiu ai récemment lancé prend en charge 16 cartes par machine et 1,5 t de mémoire vidéo, et fournit des algorithmes d'ia pour prédire les pannes de gpu avec une précision de 92 % ; alibaba cloud acs lance pour la première fois la puissance de calcul des conteneurs gpu, atteignant l'affinité informatique grâce à planification tenant compte de la topologie amélioration de la vitesse et des performances ; hpn7.0, une architecture réseau haute performance conçue pour l'ia, peut connecter de manière stable plus de 100 000 gpu, et les performances de formation de bout en bout du modèle sont améliorées de plus de 10 % ; stockage de fichiers alibaba cloud cpfs, débit de données 20 to/s, il offre des capacités de stockage exponentiellement étendues pour l'informatique intelligente de l'ia ; la plate-forme d'intelligence artificielle pai a atteint une planification élastique intégrée de la formation et du raisonnement au niveau wanka, et le taux d'utilisation efficace de l'ia ; la puissance de calcul dépasse 90 %.

au cours des deux dernières années, la taille des modèles a augmenté des milliers de fois, mais le coût en puissance de calcul des modèles continue de diminuer, ce qui rend l'utilisation des modèles moins coûteuse pour les entreprises. zhou jingren a souligné : « il s'agit du dividende technologique apporté par la réforme globale de l'infrastructure de l'ia. nous continuerons à investir dans la construction d'infrastructures d'ia avancées et à accélérer l'introduction de grands modèles dans des milliers d'industries.

il est rapporté que plus de 300 000 entreprises clientes ont accès aux grands modèles tongyi ; à l'avenir, des secteurs tels que la biomédecine, la simulation industrielle, les prévisions météorologiques et les jeux accéléreront leur adoption des grands modèles, ce qui apportera une nouvelle vague d'informatique ia. croissance de la puissance. zhou jingren a déclaré : « alibaba cloud est prêt à faire face à la croissance exponentielle de la demande de puissance de calcul gpu, en particulier le prochain marché de l'inférence. »

grand modèle avancé ouvert

au cours de l'année écoulée, la technologie des grands modèles a franchi plusieurs étapes, du grand langage à la génération vidéo en passant par les modèles multimodaux. les capacités des grands modèles continuent de s'étendre et leurs capacités en mathématiques, en codage et en raisonnement continuent de croître.

en tant qu'une des premières entreprises technologiques du secteur à proposer une technologie de grands modèles, alibaba cloud a publié le grand modèle de langage tongyi qianwen en avril de l'année dernière. désormais, la grande famille de modèles tongyi couvre entièrement tous les modes tels que le langage, l'image, la vidéo, audio, etc., avec des performances élevées. les deux sont parmi les premiers échelons au monde. dans le même temps, le modèle tongyi continue d'être open source et est devenu l'un des grands modèles nationaux populaires auprès des entreprises et des développeurs.

lors de la conférence, zhou jingren a annoncé que le modèle phare de tongyi, qwen-max, avait été mis à niveau dans tous les aspects, avec des performances proches de gpt-4o. en même temps, le modèle open source le plus puissant de la série qwen2.5 a été lancé, devenant ainsi un modèle mondial ; groupe de modèles de classe juste derrière llama aux états-unis. cette fois, un total de 100 modèles sont open source, permettant aux entreprises et aux développeurs d'utiliser de grands modèles à faible coût.

pour les scénarios de programmation, alibaba cloud tongyi lingma a été à nouveau mis à niveau et a lancé un nouveau programmeur d'ia. différent du produit de la génération précédente, il possède de multiples compétences professionnelles telles qu'architecte, ingénieur de développement et ingénieur de test, et peut effectuer indépendamment la décomposition et le code des tâches. écriture, réparation de défauts, tests et autres travaux de développement, le développement d'applications peut être réalisé en quelques minutes au plus vite, ce qui permet au développement de logiciels d'être des dizaines de fois plus efficace.

un an après la guerre des cent modèles, l’application est devenue le thème principal de la grande industrie du modélisme. en tant que première entreprise à proposer le concept de model as a service (maas), alibaba cloud a toujours considéré la prospérité du vaste écosystème de modèles comme son objectif principal. à l'heure actuelle, la communauté moda est devenue la plus grande communauté de modèles en chine, avec plus de 6,9 millions d'utilisateurs développeurs et a contribué à plus de 10 000 modèles en coopération avec des partenaires industriels.

"nous espérons que les entreprises et les développeurs pourront créer et utiliser l'ia au moindre coût, afin que chacun puisse utiliser les grands modèles les plus avancés", a déclaré zhou jingren. (li ji)

source : guangming.com

rapport/commentaires

nouvelles

zhou jingren : investir pleinement dans la mise à niveau de l'infrastructure de l'ia

introduction

mes coordonnées