Νέα

Κυκλοφόρησε η κινεζική πολυτροπική λίστα κατανόησης, η Tencent Hunyuan κατέχει την πρώτη θέση στην Κίνα

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Η πολυτροπική κατανόηση είναι μία από τις βασικές δυνατότητες των μεγάλων μοντέλων για την κατανόηση του πολύπλοκου πραγματικού κόσμου.

Στις 2 Αυγούστου, κυκλοφόρησε η λίστα αναφοράς του κινεζικού μεγάλου μοντέλου SuperCLUE-V Με την εξαιρετική του απόδοση στην πολυτροπική κατανόηση, το μεγάλο μοντέλο Tencent Hunyuan ξεχώρισε μεταξύ πολλών μοντέλων που συμμετείχαν και κέρδισε την κατάταξη του εγχώριου μεγάλου μοντέλου Τετραγωνικό εξαιρετικών ηγετών.


Η πολυτροπική κατανόηση, κοινώς γνωστή ως "εικόνες και κείμενο", απαιτεί από το μοντέλο να αναγνωρίζει με ακρίβεια στοιχεία εικόνας, να κατανοεί τις σχέσεις τους και να δημιουργεί περιγραφές φυσικής γλώσσας. Αυτό όχι μόνο δοκιμάζει την ακρίβεια της αναγνώρισης εικόνας, αλλά αντικατοπτρίζει επίσης μια ολοκληρωμένη κατανόηση της σκηνής, εις βάθος γνώση των λεπτομερειών και δοκιμάζει την κατανόηση του σύνθετου πραγματικού κόσμου από το μοντέλο.

Αυτή η αξιολόγηση καλύπτει τα 12 πιο αντιπροσωπευτικά μοντέλα πολυτροπικής κατανόησης στο εσωτερικό και στο εξωτερικό, συμπεριλαμβανομένων 4 μοντέλων στο εξωτερικό και 8 εγχώριων αντιπροσωπευτικών πολυτροπικών μοντέλων μεγάλα μοντέλα. Το μεγάλο μοντέλο Hunyuan της Tencent έλαβε υψηλή βαθμολογία 71,95 όσον αφορά τις βασικές δυνατότητες πολλαπλών μέσων και τις δυνατότητες εφαρμογής, δείχνοντας τα ολοκληρωμένα πλεονεκτήματά του στα επίπεδα τεχνολογίας και εφαρμογής.


Σύμφωνα με τους υπεύθυνους του SuperCLUE, τα κριτήρια αξιολόγησης καλύπτουν διαστάσεις όπως η ακρίβεια της κατανόησης, η συνάφεια των απαντήσεων και το βάθος της συλλογιστικής.

Τα αποτελέσματα της αξιολόγησης δείχνουν ότι τα εγχώρια μεγάλα μοντέλα έχουν προσεγγίσει τα κορυφαία μοντέλα του εξωτερικού όσον αφορά τις βασικές δυνατότητες κατανόησης πολλαπλών μέσων, μεταξύ αυτών, η συνολική βαθμολογία του μεγάλου μοντέλου Tencent Hunyuan είναι ελαφρώς χαμηλότερη από το GPT-4o και η απόδοσή του είναι καλύτερη. από το CLaude3.5-Sonnet και το Gemini-1.5-Pro ​​δείχνει την ταχεία επανάληψη των εγχώριων μοντέλων σε βασικές δυνατότητες. Όσον αφορά τις δυνατότητες εφαρμογών, το μεγάλο μοντέλο Hunyuan της Tencent παρουσιάζει μεγάλες δυνατότητες για πρακτικές εφαρμογές με τη βαθιά κατανόηση του κινεζικού πλαισίου και τις ολοκληρωμένες δυνατότητές του γενικά, την κοινή λογική, τις εικόνες και άλλα πεδία.


Βασιζόμενη στην τεχνική βάση του μεγάλου μοντέλου Tencent Hunyuan, η εγγενής εφαρμογή AI Tencent Yuanbao έχει ικανότητα κατανόησης πολλαπλών τρόπων από την αρχή της κυκλοφορίας της, είτε πρόκειται για στιγμιότυπα οθόνης εγγράφων, πορτρέτα και τοπία, αποδείξεις ταμείου ή οποιαδήποτε τυχαία φωτογραφία. Yuanbao Όλοι μπορούν να δώσουν τη δική τους κατανόηση και ανάλυση με βάση το περιεχόμενο της εικόνας.


Ο Jiang Jie, αντιπρόεδρος της Tencent, είπε προηγουμένως ότι η πολυτροπικότητα είναι μια "πρέπει να απαντηθεί" για το μοντέλο Hunyuan της Tencent Επί του παρόντος, το μοντέλο Hunyuan αναπτύσσει ενεργά τεχνολογίες από πολυτροπικό σε πλήρες και σύντομα οι χρήστες θα έχουν εμπειρία στο Kuai στο Tencent Yuanbao. Εφαρμογή, εσωτερική επιχείρηση και σενάρια της Tencent και θα είναι ανοιχτή σε εξωτερικές εφαρμογές μέσω του Tencent Cloud.

Προς το παρόν, το μεγάλο υβριδικό μοντέλο της Tencent έχει επεκταθεί σε κλίμακα τρισεκατομμυρίων παραμέτρων. Είναι το πρώτο στην Κίνα που υιοθετεί τη δομή του υβριδικού μοντέλου εμπειρογνωμόνων (MoE) Βασιζόμενος στις δυνατότητες του μεγάλου γλωσσικού μοντέλου της Tencent. έχουν βελτιωθεί συνεχώς, φτάνοντας στο κορυφαίο εγχώριο επίπεδο.

leifeng.com