haciendo historia, el modelo de código abierto qwen2.5 de alibaba tongyi entra entre los diez primeros en la prueba a ciegas de modelos grandes del mundo

haciendo historia, el modelo de código abierto qwen2.5 de alibaba tongyi entró entre los diez primeros del mundo en la prueba a ciegas de modelos grandes

2024-09-30

el reportero cliente de chao news, zhang yunshan

según las noticias del 29 de septiembre, la plataforma de pruebas de referencia chatbot arena anunció recientemente la última lista de pruebas ciegas de modelos grandes. el modelo de código abierto qwen2.5 de alibaba tongyi, lanzado hace 10 días, una vez más se ubicó entre los diez primeros del mundo. el modelo de lenguaje grande qwen2.5 -72b-instruct ocupa el décimo lugar en la lista llm y es el único modelo grande chino entre los diez primeros. el modelo de lenguaje visual de la serie qwen qwen2-vl-72b-instruct ocupa el noveno lugar en la lista vision y es el más alto. -puntuación de modelo grande de código abierto.

al mismo tiempo, el número de modelos derivados desarrollados por la comunidad global de código abierto basado en el desarrollo secundario de la serie qwen superó los 74.300, superando los 72.800 modelos derivados de la serie llama. tongyi qianwen qwen se ha convertido en la familia de modelos de lenguaje generativo más grande del mundo. en la tabla de clasificación open llm, la lista autorizada de modelos de código abierto en la comunidad hugging face, la serie qwen y sus modelos derivados han ocupado los diez primeros lugares.

ya sea por el rendimiento del modelo o la influencia ecológica, qwen ha creado la historia de los grandes modelos de código abierto en china.

qwen2.5-72b-instruct ocupa el décimo lugar en la lista de modelos de lenguaje grande de chatbot arena

chatbot arena es una plataforma de prueba de rendimiento de modelos grandes lanzada por la organización de investigación abierta lmsys org. desde su lanzamiento en mayo de 2023, ha sido el escenario más importante para los modelos grandes más importantes del mundo. actualmente, la plataforma integra más de 70 modelos grandes en todo el mundo. los modelos grandes se dividen de forma anónima en pares y se entregan a los usuarios para que los prueben a ciegas. los usuarios votan sobre las capacidades del modelo basándose en una experiencia de conversación real.

qwen2.5, lanzado el 19 de septiembre, entró rápidamente en la lista. la puntuación del modelo insignia qwen2.5-72b-instruct ocupó el décimo lugar en la lista llm, detrás de o1, gpt-4o y otros modelos de openai, y es el grande chino. el modelo con la puntuación más alta qwen2-vl-72b-instruct, un modelo de lenguaje visual de código abierto el mismo día, ocupó el noveno lugar en la lista de vision, ligeramente por detrás de modelos de código cerrado como gpt-4o y gemini. -1.5-pro y es el modelo de código abierto con mejor rendimiento. anteriormente, varios modelos de código abierto de la serie qwen ingresaron a la lista de chatbot arena.

chatbot arena anunció oficialmente que qwen2-vl-72b-instruct es el modelo de lenguaje visual de código abierto de mayor rango

el lanzamiento de qwen2.5 provocó un carnaval en la comunidad de código abierto en el país y en el extranjero. este conjunto de modelos de código abierto cubre modelos de lenguaje grandes, modelos multimodales, modelos matemáticos y modelos de código de múltiples tamaños. logró la misma escala en la industria. mejor rendimiento, más de 1,5 millones de descargas en 10 días desde su lanzamiento. algunos desarrolladores extranjeros elogiaron a tongyi qianwen como una verdadera "ia abierta"; algunas reseñas de usuarios encontraron que qwen2.5 tiene un nivel sota de 0.5b a 72b, por lo que comenzaron un tema: "todos lo han reemplazado con qwen2.5. ¿modelos usados?

las comunidades de código abierto en el extranjero elogian qwen2.5

"por favor indique la fuente al reimprimir"

informe/comentarios

noticias

haciendo historia, el modelo de código abierto qwen2.5 de alibaba tongyi entró entre los diez primeros del mundo en la prueba a ciegas de modelos grandes

introducción

mi información de contacto