소식

중국 대형 모델에 대한 최신 평가가 공개되었습니다: Tencent Hunyuan이 중국에서 1위를 차지했습니다!

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kuai Technology는 8월 5일 중국 멀티모달 대형 모델에 대한 최신 SuperCLUE-V 벤치마크 평가에서 Tencent의 Hunyuan 대형 모델이 국내 1위를 차지해 우수 리더 쿼드런트(Excellent Leaders Quadrant)에 확고하게 자리매김했다고 보도했습니다.

이 평가는 복잡한 현실 세계, 즉 일반적으로 "그림과 텍스트"로 알려진 다중 모드 이해를 이해하는 대형 모델의 핵심 능력에 중점을 둡니다.

다중 모드 이해에는 이미지 요소를 정확하게 식별하고, 이미지 요소 간의 관계를 이해하고, 자연어 설명을 생성할 수 있는 모델이 필요합니다.

이 능력은 이미지 인식의 정확성을 테스트할 뿐만 아니라 장면에 대한 포괄적인 이해와 세부 사항에 대한 심층적인 통찰력을 반영합니다. 이는 복잡한 현실 세계에 대한 모델의 이해를 측정하는 중요한 기준입니다.

이번 평가에는 국내외 대표 멀티모달 이해 대형 모델 총 12개가 참여했다. 텐센트 훈위안 대형 모델은 멀티모달 기본 역량과 적용 역량 모두에서 상당한 우위를 보이며 종합점수에서 높은 점수를 받았다. 71.95.

평가기준은 이해의 정확성, 응답의 타당성, 추론의 깊이 등을 포함하여 평가의 과학성과 공정성을 보장합니다.

Tencent의 Hunyuan 대형 모델은 기본 기능 측면에서 해외 상위 모델을 거의 따르고 있으며, 전체 점수는 GPT-4o보다 약간 낮고 성능은 CLaude3.5-Sonnet 및 Gemini-1.5-Pro보다 우수합니다.

응용 능력 측면에서 중국 상황에 대한 깊은 이해와 일반 상식, 이미지 및 기타 분야의 포괄적인 능력을 갖춘 Tencent의 Hunyuan 대형 모델은 실제 응용에 대한 큰 잠재력을 보여줍니다.