uutiset

Uusin arvio kiinalaisista suurista malleista on julkaistu: Tencent Hunyuan on ykkönen Kiinassa!

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kuai Technology raportoi 5. elokuuta, että viimeisimmässä kiinalaisten multimodaalisten suurten mallien SuperCLUE-V-vertailuarvioinnissa Tencentin Hunyuan-suurmalli sijoittui maan ensimmäiselle sijalle ja sijoittui vakaasti Excellent Leaders -kvadrantissa.

Tämä arviointi keskittyy suurten mallien keskeiseen kykyyn ymmärtää monimutkaista todellista maailmaa, toisin sanoen multimodaalista ymmärrystä, joka tunnetaan yleisesti nimellä "kuvat ja teksti".

Multimodaalinen ymmärrys vaatii malleja, jotka pystyvät tunnistamaan kuvaelementit tarkasti, ymmärtämään niiden välisiä suhteita ja luomaan luonnollisen kielen kuvauksia.

Tämä kyky ei vain testaa kuvantunnistuksen tarkkuutta, vaan heijastaa myös kokonaisvaltaista ymmärrystä näkymästä ja syvällistä näkemystä yksityiskohdista. Se on tärkeä kriteeri, kun mitataan mallin ymmärrystä monimutkaisesta todellisesta maailmasta.

Tähän arviointiin osallistui yhteensä 12 edustavaa multimodaalista ymmärrystä kotimaassa ja ulkomailla. Tencent Hunyuanin suuri malli osoitti merkittäviä etuja sekä multimodaalisissa perusominaisuuksissa että sovellusominaisuuksissa, ja se sai korkean pistemäärän 71,95.

Arviointikriteerit kattavat muun muassa ymmärryksen tarkkuuden, vastauksen relevanssin ja perustelun syvyys, mikä varmistaa arvioinnin tieteellisyyden ja oikeudenmukaisuuden.

Tencentin Hunyuan-suurmalli seuraa tiiviisti ulkomaisia ​​huippumalleja perusominaisuuksiltaan Sen kokonaispistemäärä on vain hieman pienempi kuin GPT-4o, ja sen suorituskyky on parempi kuin CLaude3.5-Sonnet ja Gemini-1.5-Pro.

Mitä tulee sovellusominaisuuksiin, sen syvällinen ymmärrys Kiinan kontekstista ja kattavat valmiudet yleensä, maalaisjärkeä, kuvia ja muilla aloilla, Tencentin Hunyuan-suurmalli tarjoaa suuria mahdollisuuksia käytännön sovelluksiin.