中国大型モデルの最新評価を公開：Tencent Hunyuanが中国1位に！

2024-08-05

Kuai Technology は 8 月 5 日、中国のマルチモーダル大型モデルの最新の SuperCLUE-V ベンチマーク評価で、Tencent の Hunyuan 大型モデルが国内で 1 位にランクされ、エクセレントリーダークアドラントに確実にランクされたと報告しました。

この評価は、複雑な現実世界を理解するための大規模モデルの重要な能力、つまり、一般に「画像とテキスト」として知られるマルチモーダルな理解に焦点を当てています。

マルチモーダルな理解には、画像要素を正確に識別し、要素間の関係を理解し、自然言語記述を生成できるモデルが必要です。

この能力は、画像認識の精度をテストするだけでなく、シーンの包括的な理解と詳細に対する深い洞察も反映します。これは、複雑な現実世界に対するモデルの理解を測定するための重要な基準です。

今回の評価では、国内外の代表的なマルチモーダル理解大型モデル計12社が参加し、Tencent Hunyuan大型モデルはマルチモーダル基本機能と応用機能の両方で顕著な優位性を示し、総合スコアAを獲得した。 71.95。

評価基準は、理解の正確さ、対応の妥当性、推論の深さなどの側面を網羅しており、評価の科学性と公平性が確保されています。

Tencent の Hunyuan 大型モデルは、基本的な機能の点で海外の上位モデルにほぼ準拠しており、総合スコアは GPT-4o よりもわずかに低いだけで、パフォーマンスは CLaude3.5-Sonnet や Gemini-1.5-Pro よりも優れています。

応用能力の面では、中国の文脈に対する深い理解と、一般、常識、画像、その他の分野における包括的な能力を備えたテンセントの渾源大型モデルは、実用化の大きな可能性を示しています。

ニュース