역사를 쓰다 alibaba tongyi의 오픈소스 모델 qwen2.5, 대형 모델 블라인드 테스트 세계 10위권 진입

역사를 쓰다 alibaba tongyi의 오픈소스 모델 qwen2.5가 대형 모델 블라인드 테스트에서 세계 10위 안에 진입했습니다.

2024-09-30

차오뉴스 고객 기자 장윤산

9월 29일 뉴스에 따르면, 벤치마크 테스트 플랫폼 챗봇 아레나(chatbot arena)는 최근 대형 모델의 최신 블라인드 테스트 목록을 발표했다. 열흘 전 출시된 알리바바 tongyi qianwen 오픈소스 모델 qwen2.5가 다시 한번 세계 10위권에 진입했다. 대형 언어 모델 qwen2.5 -72b-instruct는 llm 목록에서 10위를 차지했으며 상위 10위 안에 드는 유일한 중국 대형 모델입니다. qwen2-vl-72b-instruct는 vision 목록에서 9위를 차지했으며 최고 수준입니다. -점수 오픈 소스 대형 모델.

동시에 qwen 시리즈의 2차 개발을 기반으로 글로벌 오픈소스 커뮤니티에서 개발한 파생 모델의 수가 74,300개를 초과하여 llama 시리즈의 파생 모델 72,800개를 넘어섰습니다. tongyi qianwen qwen은 hugging face 커뮤니티의 권위 있는 오픈 소스 모델 목록인 open llm 리더보드에서 세계 최대의 생성 언어 모델 제품군으로 성장했습니다. qwen 시리즈와 그 파생 모델이 상위 10위권을 모두 차지했습니다.

모델 성능이든 생태학적 영향이든 qwen은 중국에서 오픈 소스 대형 모델의 역사를 만들었습니다.

qwen2.5-72b-instruct는 chatbot arena 대규모 언어 모델 목록에서 10위를 차지했습니다.

챗봇 아레나는 공개 연구 기관인 lmsys org가 출시한 대형 모델 성능 테스트 플랫폼으로, 2023년 5월 출시 이후 세계 최고 수준의 대형 모델들의 가장 중요한 무대로 자리매김해 왔습니다. 이 플랫폼은 현재 전 세계 70개 이상의 대형 모델을 통합하고 있으며, 대형 모델은 익명으로 쌍으로 나누어 사용자에게 블라인드 테스트를 제공합니다. 사용자는 실제 대화 경험을 바탕으로 모델 기능에 투표합니다.

9월 19일 출시된 qwen2.5는 플래그십 모델 qwen2.5-72b-instruct의 점수가 openai의 o1, gpt-4o 및 기타 모델에 이어 llm 목록에서 10위를 차지했으며 중국 대형 제품입니다. 같은 날 오픈 소스 시각적 언어 모델인 qwen2-vl-72b-instruct는 vision 목록에서 gpt-4o 및 gemini와 같은 비공개 소스 모델에 약간 뒤진 9위를 차지했습니다. -1.5-pro는 최고 성능의 오픈 소스 모델입니다. 이전에는 qwen 시리즈의 여러 오픈 소스 모델이 chatbot arena 목록에 포함되었습니다.

chatbot arena는 qwen2-vl-72b-instruct가 최고 순위의 오픈 소스 시각적 언어 모델이라고 공식 발표했습니다.

qwen2.5의 출시는 국내외 오픈 소스 커뮤니티에서 카니발을 촉발시켰습니다. 이 오픈 소스 모델 세트는 대규모 언어 모델, 다중 모드 모델, 수학적 모델 및 다양한 크기의 코드 모델을 포함합니다. 출시 10일 만에 다운로드 150만 건을 넘어 업계 최고 수준의 성과를 거뒀다. 일부 외국 개발자는 tongyi qianwen을 진정한 "개방형 ai"라고 칭찬했습니다. 일부 사용자 리뷰에서는 qwen2.5가 0.5b에서 72b까지의 sota 수준이라는 사실을 확인하고 다음과 같은 주제를 시작했습니다. 중고 모델이요?”

해외 오픈소스 커뮤니티, qwen2.5 칭찬

"재인쇄시 출처를 밝혀주세요"

보고/피드백

소식

역사를 쓰다 alibaba tongyi의 오픈소스 모델 qwen2.5가 대형 모델 블라인드 테스트에서 세계 10위 안에 진입했습니다.

소개

내 연락처 정보