fazendo história, o modelo de código aberto qwen2.5 do alibaba tongyi entra entre os dez primeiros no teste cego mundial de grandes modelos

fazendo história, o modelo de código aberto qwen2.5 do alibaba tongyi entrou entre os dez primeiros do mundo no teste cego de grandes modelos

2024-09-30

repórter cliente do chao news, zhang yunshan

de acordo com notícias de 29 de setembro, a plataforma de testes de benchmark chatbot arena anunciou recentemente a última lista de testes cegos de grandes modelos. o modelo de código aberto alibaba tongyi qianwen qwen2.5 lançado há 10 dias mais uma vez entrou no top ten do mundo. o modelo de linguagem grande qwen2.5 -72b-instruct ocupa o décimo lugar na lista llm e é o único modelo grande chinês entre os dez primeiros; o modelo de linguagem visual da série qwen qwen2-vl-72b-instruct ocupa o nono lugar na lista vision e é o mais alto; -pontuação de modelo grande de código aberto.

ao mesmo tempo, o número de modelos derivados desenvolvidos pela comunidade global de código aberto com base no desenvolvimento secundário da série qwen ultrapassou 74.300, ultrapassando os 72.800 modelos derivados da série llama. tongyi qianwen qwen cresceu e se tornou a maior família de modelos de linguagem generativa do mundo. no open llm leaderboard, a lista oficial de modelos de código aberto na comunidade hugging face, a série qwen e seus modelos derivados ocuparam todos os dez primeiros lugares.

quer se trate do desempenho do modelo ou da influência ecológica, qwen criou a história dos grandes modelos de código aberto na china.

qwen2.5-72b-instruct ocupa o décimo lugar na grande lista de modelos de linguagem do chatbot arena

chatbot arena é uma plataforma de teste de desempenho de modelos grandes lançada pela organização de pesquisa aberta lmsys org. desde seu lançamento em maio de 2023, tem sido a arena mais importante para os principais modelos de grande porte do mundo. a plataforma integra atualmente mais de 70 modelos grandes em todo o mundo. os modelos grandes são divididos anonimamente em pares e entregues aos usuários para testes cegos.

qwen2.5, lançado em 19 de setembro, entrou rapidamente na lista a pontuação do modelo carro-chefe qwen2.5-72b-instruct ficou em décimo lugar na lista llm, atrás do o1, gpt-4o e outros modelos da openai, e é o grande chinês. modelo com a pontuação mais alta qwen2-vl-72b-instruct, um modelo de linguagem visual de código aberto no mesmo dia, ficou em nono lugar na lista vision, um pouco atrás de modelos de código fechado como gpt-4o e gemini. -1.5-pro e é o modelo de código aberto com melhor desempenho. anteriormente, vários modelos de código aberto da série qwen entraram na lista do chatbot arena.

a chatbot arena anunciou oficialmente que qwen2-vl-72b-instruct é o modelo de linguagem visual de código aberto de mais alta classificação

o lançamento do qwen2.5 desencadeou um carnaval na comunidade de código aberto no país e no exterior. este conjunto de modelos de código aberto abrange modelos de linguagem de grande porte, modelos multimodais, modelos matemáticos e modelos de código de vários tamanhos. alcançou a mesma escala na indústria melhor desempenho, mais de 1,5 milhão de downloads em 10 dias de lançamento. alguns desenvolvedores estrangeiros elogiaram tongyi qianwen como uma verdadeira "ia aberta"; algumas análises de usuários descobriram que qwen2.5 tem nível sota de 0,5b a 72b, então eles iniciaram um tópico: "todo mundo o substituiu por qwen2.5 quais são os comumente usados? modelos usados?”

comunidades internacionais de código aberto elogiam qwen2.5

"por favor, indique a fonte ao reimprimir"

relatório/comentários

notícias

fazendo história, o modelo de código aberto qwen2.5 do alibaba tongyi entrou entre os dez primeiros do mundo no teste cego de grandes modelos

introdução

minhas informações de contato