entre dans l’histoire, le modèle open source qwen2.5 d’alibaba tongyi entre dans le top dix du test aveugle mondial des grands modèles

entre dans l'histoire, le modèle open source qwen2.5 d'alibaba tongyi est entré dans le top dix mondial lors du test aveugle des grands modèles

2024-09-30

zhang yunshan, journaliste client de chao news

selon les informations du 29 septembre, la plate-forme de test de référence chatbot arena a récemment annoncé la dernière liste de tests à l'aveugle de grands modèles. le modèle open source alibaba tongyi qianwen, qwen2.5, publié il y a 10 jours, est à nouveau entré dans le top dix mondial. le grand modèle de langage qwen2.5 -72b-instruct se classe dixième sur la liste llm et est le seul grand modèle chinois dans le top dix ; le modèle de langage visuel de la série qwen, qwen2-vl-72b-instruct, se classe neuvième sur la liste vision et est le plus élevé. -notation d'un grand modèle open source.

dans le même temps, le nombre de modèles dérivés développés par la communauté open source mondiale sur la base du développement secondaire de la série qwen a dépassé 74 300, dépassant les 72 800 modèles dérivés de la série llama. tongyi qianwen qwen est devenue la plus grande famille de modèles de langage génératif au monde. dans le classement open llm, la liste faisant autorité des modèles open source de la communauté hugging face, la série qwen et ses modèles dérivés ont occupé les dix premières places.

qu'il s'agisse de performances du modèle ou d'influence écologique, qwen a créé l'histoire des grands modèles open source en chine.

qwen2.5-72b-instruct se classe dixième sur la liste des grands modèles de langage chatbot arena

chatbot arena est une plateforme de test de performances de grands modèles lancée par l'organisation de recherche ouverte lmsys org. depuis son lancement en mai 2023, elle est l'arène la plus importante pour les meilleurs grands modèles du monde. la plateforme intègre actuellement plus de 70 grands modèles dans le monde. les grands modèles sont divisés de manière anonyme en paires et remis aux utilisateurs pour des tests à l'aveugle. les utilisateurs votent sur les capacités du modèle sur la base d'une expérience de conversation réelle.

qwen2.5, sorti le 19 septembre, est rapidement entré dans la liste. le score du modèle phare qwen2.5-72b-instruct s'est classé dixième sur la liste llm, derrière l'o1 d'openai, le gpt-4o et d'autres modèles, et est le grand chinois. modèle avec le score le plus élevé ; qwen2-vl-72b-instruct, un modèle de langage visuel open source, s'est hissé à la neuvième place de la liste vision, légèrement derrière les modèles fermés tels que gpt-4o et gemini. -1.5-pro, et est le modèle open source le plus performant. auparavant, plusieurs modèles open source de la série qwen étaient entrés dans la liste chatbot arena.

chatbot arena a officiellement annoncé que qwen2-vl-72b-instruct est le modèle de langage visuel open source le mieux classé

la sortie de qwen2.5 a déclenché un carnaval dans la communauté open source au pays et à l'étranger. cet ensemble de modèles open source couvre de grands modèles de langage, des modèles multimodaux, des modèles mathématiques et des modèles de code de plusieurs tailles. a atteint la même échelle dans l'industrie. meilleure performance, plus de 1,5 million de téléchargements en 10 jours après sa sortie. certains développeurs étrangers ont salué tongyi qianwen comme une véritable « ia ouverte » ; certains avis d'utilisateurs ont révélé que qwen2.5 est un niveau sota de 0,5b à 72b, ils ont donc lancé un sujet : « tout le monde l'a remplacé par qwen2.5. modèles d’occasion ?

les communautés open source étrangères font l’éloge de qwen2.5

"veuillez indiquer la source lors de la réimpression"

rapport/commentaires

nouvelles

entre dans l'histoire, le modèle open source qwen2.5 d'alibaba tongyi est entré dans le top dix mondial lors du test aveugle des grands modèles

introduction

mes coordonnées