notícias

A última avaliação dos grandes modelos chineses foi lançada: Tencent Hunyuan ocupa o primeiro lugar na China!

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A Kuai Technology informou em 5 de agosto que na última avaliação de benchmark SuperCLUE-V de grandes modelos multimodais chineses, o grande modelo Hunyuan da Tencent ficou em primeiro lugar no país, classificando-se firmemente no Quadrante de Líderes Excelentes.

Esta avaliação centra-se na capacidade fundamental dos grandes modelos para compreender o complexo mundo real, ou seja, a compreensão multimodal, vulgarmente conhecida como "imagens e texto".

A compreensão multimodal requer modelos que possam identificar com precisão os elementos da imagem, compreender as relações entre eles e gerar descrições em linguagem natural.

Essa capacidade não apenas testa a precisão do reconhecimento de imagem, mas também reflete uma compreensão abrangente da cena e uma visão aprofundada dos detalhes. É um critério importante para medir a compreensão do modelo do complexo mundo real.

Nesta avaliação, participaram um total de 12 grandes modelos representativos de compreensão multimodal no país e no exterior. O grande modelo Tencent Hunyuan mostrou vantagens significativas tanto em capacidades básicas multimodais quanto em capacidades de aplicação e recebeu a pontuação geral de uma pontuação alta. 71,95.

Os critérios de avaliação abrangem dimensões como precisão de compreensão, relevância da resposta e profundidade de raciocínio, garantindo a cientificidade e justiça da avaliação.

O grande modelo Hunyuan da Tencent segue de perto os principais modelos estrangeiros em termos de capacidades básicas. Sua pontuação geral é apenas ligeiramente inferior ao GPT-4o e seu desempenho é melhor que o CLaude3.5-Sonnet e o Gemini-1.5-Pro.

Em termos de capacidades de aplicação, com a sua profunda compreensão do contexto chinês e capacidades abrangentes em geral, bom senso, imagens e outros campos, o grande modelo Hunyuan da Tencent mostra um grande potencial para aplicação prática.