歴史を作る、alibaba tongyi のオープンソース モデル qwen2.5 が大規模モデルのブラインド テストで世界トップ 10 入り
2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
chao newsクライアント記者の張雲山
9 月 29 日のニュースによると、ベンチマーク テスト プラットフォームであるチャットボット アリーナは、10 日前にリリースされた alibaba tongyi qianwen オープンソース モデル qwen2.5 が再び世界のトップ 10 にランクインしたと発表しました。大規模言語モデル qwen2.5 -72b-instruct は、llm リストで 10 位にランクされ、トップ 10 に入っている唯一の中国語大型モデルです。qwen シリーズのビジュアル言語モデル qwen2-vl-72b-instruct は、vision リストで 9 位にランクされ、最高位です。 -スコアリングオープンソースの大規模モデル。
同時に、qwenシリーズの二次開発に基づいて世界のオープンソースコミュニティによって開発された派生モデルの数は74,300を超え、llamaシリーズの派生モデルの72,800を上回りました。 tongyi qianwen qwen は世界最大の生成言語モデル ファミリーに成長しました。hugging face コミュニティのオープン ソース モデルの権威あるリストである open llm leaderboard では、qwen シリーズとその派生モデルがトップ 10 の席すべてを占めています。
モデルのパフォーマンスであれ、環境への影響であれ、qwen は中国におけるオープンソースの大規模モデルの歴史を築き上げてきました。
qwen2.5-72b-instruct は、chatbot arena の大規模言語モデル リストで 10 位にランクされています
chatbot arena は、オープン研究組織 lmsys org によって立ち上げられた大型モデルのパフォーマンス テスト プラットフォームで、2023 年 5 月の立ち上げ以来、世界のトップ大型モデルにとって最も重要なアリーナとなっています。このプラットフォームには現在、世界中の 70 以上の大規模なモデルが統合されており、大規模なモデルは匿名でペアに分割され、ユーザーが実際の会話体験に基づいてモデルの機能を投票します。
9 月 19 日にリリースされた qwen2.5 はすぐにリストに入り、フラッグシップ モデル qwen2.5-72b-instruct のスコアは、openai の o1、gpt-4o などのモデルに次いで llm リストで 10 位にランクされました。 ; 最も高いスコアを獲得したモデルは、同日のオープンソースのビジュアル言語モデルである qwen2-vl-72b-instruct で、gpt-4o や gemini などのクローズドソース モデルにわずかに遅れて 9 位にランクインしました。 -1.5-pro であり、最もパフォーマンスの高いオープンソース モデルです。これまでに、qwen シリーズのいくつかのオープンソース モデルがチャットボット アリーナのリストに登録されていました。
chatbot arena は、qwen2-vl-72b-instruct が最高ランクのオープンソースビジュアル言語モデルであると正式に発表しました
qwen2.5 のリリースは、国内外のオープン ソース コミュニティでカーニバルを引き起こしました。この一連のオープン ソース モデルは、大規模な言語モデル、マルチモーダル モデル、数学的モデル、およびさまざまなサイズのコード モデルをカバーしています。リリースから10日間で150万ダウンロードを突破し、業界最高のパフォーマンスを達成しました。海外の開発者の中には、tongyi qianwen を真の「オープン ai」であると称賛した人もいました。一部のユーザー レビューでは、qwen2.5 が 0.5b から 72b までの sota レベルであることが判明したため、「誰もが qwen2.5 に置き換えました。一般的なものは何ですか」と話題になりました。中古モデル?」
海外のオープンソースコミュニティがqwen2.5を称賛
海外のオープンソースコミュニティがqwen2.5を称賛
「転載の際は出典を明記してください」