歴史を作る、alibaba tongyi のオープンソースモデル qwen2.5 が世界の大規模モデルのブラインドテストでトップ 10 入り

歴史を作る、alibaba tongyi のオープンソースモデル qwen2.5 が大規模モデルのブラインドテストで世界トップ 10 入り

2024-09-30

chao newsクライアント記者の張雲山

9 月 29 日のニュースによると、ベンチマークテストプラットフォームであるチャットボットアリーナは、10 日前にリリースされた alibaba tongyi qianwen オープンソースモデル qwen2.5 が再び世界のトップ 10 にランクインしたと発表しました。大規模言語モデル qwen2.5 -72b-instruct は、llm リストで 10 位にランクされ、トップ 10 に入っている唯一の中国語大型モデルです。qwen シリーズのビジュアル言語モデル qwen2-vl-72b-instruct は、vision リストで 9 位にランクされ、最高位です。 -スコアリングオープンソースの大規模モデル。

同時に、qwenシリーズの二次開発に基づいて世界のオープンソースコミュニティによって開発された派生モデルの数は74,300を超え、llamaシリーズの派生モデルの72,800を上回りました。 tongyi qianwen qwen は世界最大の生成言語モデルファミリーに成長しました。hugging face コミュニティのオープンソースモデルの権威あるリストである open llm leaderboard では、qwen シリーズとその派生モデルがトップ 10 の席すべてを占めています。

モデルのパフォーマンスであれ、環境への影響であれ、qwen は中国におけるオープンソースの大規模モデルの歴史を築き上げてきました。

qwen2.5-72b-instruct は、chatbot arena の大規模言語モデルリストで 10 位にランクされています

chatbot arena は、オープン研究組織 lmsys org によって立ち上げられた大型モデルのパフォーマンステストプラットフォームで、2023 年 5 月の立ち上げ以来、世界のトップ大型モデルにとって最も重要なアリーナとなっています。このプラットフォームには現在、世界中の 70 以上の大規模なモデルが統合されており、大規模なモデルは匿名でペアに分割され、ユーザーが実際の会話体験に基づいてモデルの機能を投票します。

9 月 19 日にリリースされた qwen2.5 はすぐにリストに入り、フラッグシップモデル qwen2.5-72b-instruct のスコアは、openai の o1、gpt-4o などのモデルに次いで llm リストで 10 位にランクされました。 ; 最も高いスコアを獲得したモデルは、同日のオープンソースのビジュアル言語モデルである qwen2-vl-72b-instruct で、gpt-4o や gemini などのクローズドソースモデルにわずかに遅れて 9 位にランクインしました。 -1.5-pro であり、最もパフォーマンスの高いオープンソースモデルです。これまでに、qwen シリーズのいくつかのオープンソースモデルがチャットボットアリーナのリストに登録されていました。

chatbot arena は、qwen2-vl-72b-instruct が最高ランクのオープンソースビジュアル言語モデルであると正式に発表しました

qwen2.5 のリリースは、国内外のオープンソースコミュニティでカーニバルを引き起こしました。この一連のオープンソースモデルは、大規模な言語モデル、マルチモーダルモデル、数学的モデル、およびさまざまなサイズのコードモデルをカバーしています。リリースから10日間で150万ダウンロードを突破し、業界最高のパフォーマンスを達成しました。海外の開発者の中には、tongyi qianwen を真の「オープン ai」であると称賛した人もいました。一部のユーザーレビューでは、qwen2.5 が 0.5b から 72b までの sota レベルであることが判明したため、「誰もが qwen2.5 に置き換えました。一般的なものは何ですか」と話題になりました。中古モデル？」

海外のオープンソースコミュニティがqwen2.5を称賛

「転載の際は出典を明記してください」

レポート/フィードバック

ニュース

歴史を作る、alibaba tongyi のオープンソースモデル qwen2.5 が大規模モデルのブラインドテストで世界トップ 10 入り

導入

私の連絡先情報

ニュース

歴史を作る、alibaba tongyi のオープンソース モデル qwen2.5 が大規模モデルのブラインド テストで世界トップ 10 入り

導入

私の連絡先情報

歴史を作る、alibaba tongyi のオープンソースモデル qwen2.5 が大規模モデルのブラインドテストで世界トップ 10 入り