notizia

Pubblicata l'ultima valutazione dei grandi modelli cinesi: Hunyuan è al primo posto

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kuai Technology ha riferito il 5 agosto che nell'ultima valutazione benchmark SuperCLUE-V dei grandi modelli multimodali cinesi, il grande modello Hunyuan di Tencent si è classificato al primo posto nel paese, posizionandosi saldamente nel quadrante dei leader eccellenti.

Questa valutazione si concentra sulla capacità chiave dei modelli di grandi dimensioni di comprendere il complesso mondo reale, ovvero la comprensione multimodale, comunemente nota come "immagini e testo".

La comprensione multimodale richiede modelli in grado di identificare accuratamente gli elementi dell'immagine, comprendere le relazioni tra loro e generare descrizioni in linguaggio naturale.

Questa capacità non solo mette alla prova l'accuratezza del riconoscimento delle immagini, ma riflette anche una comprensione completa della scena e una visione approfondita dei dettagli. È un criterio importante per misurare la comprensione del modello del complesso mondo reale.

A questa valutazione hanno partecipato un totale di 12 modelli rappresentativi di comprensione multimodale in patria e all'estero. Il modello di grandi dimensioni Tencent Hunyuan ha mostrato vantaggi significativi sia nelle capacità di base multimodali che nelle capacità applicative e ha ricevuto un punteggio complessivo di A 71,95.

I criteri di valutazione coprono dimensioni quali l’accuratezza della comprensione, la pertinenza della risposta e la profondità del ragionamento, garantendo la scientificità e l’equità della valutazione.

Il modello grande Hunyuan di Tencent segue da vicino i migliori modelli esteri in termini di capacità di base. Il suo punteggio complessivo è solo leggermente inferiore a GPT-4o e le sue prestazioni sono migliori di CLaude3.5-Sonnet e Gemini-1.5-Pro.

In termini di capacità applicative, con la sua profonda comprensione del contesto cinese e capacità complete in generale, buon senso, immagini e altri campi, il grande modello Hunyuan di Tencent mostra un grande potenziale per l'applicazione pratica.