teleai sai päätökseen ensimmäisen kansallisesti tuotetun wanka wangan -suurmallin koulutuksen ja avoimen lähdekoodin telechat2-115b

teleai suoritti ensimmäisen kansallisen tuotannon wanka wanganin suuren mallikoulutuksen, avoimen lähdekoodin telechat2-115b

2024-09-29

china telecom artificial intelligence research institute (teleai) suoritti äskettäin onnistuneesti ensimmäisen biljoonaparametrin suuren mallin kiinassa, joka perustuu kansallisesti tuotettuun wanka-klusterikoulutukseen (jota kutsutaan nimellä wanka wancan), ja virallisesti avoimen lähdekoodin ensimmäinen kotimainen malli. tuotettu malli, joka perustuu kansallisesti tuotettuun wanka-klusteriin, telechat2-115b, suuri malli, jossa on satoja miljardeja huawanka-klusterin kouluttamia parametreja ja kotimainen syväoppimiskehys, on suuri malli star semanticsista.

tämä on toinen virstanpylväs ja tärkeä tieteellinen tutkimussaavutus, jota johtaa professori li xuelong, china telecom groupin päätutkija ja china telecomin tekoälyn tutkimusinstituutin dekaani. se osoittaa, että kotimainen laajamittainen mallikoulutus on todella ymmärtänyt kansallistamisen korvaamisen ja astui virallisesti markkinoille. uusi vaihe itsenäisessä innovatiivisessa, turvallisuudessa ja hallinnassa kotimaisessa tuotannossa.

telechat2-115b on koulutettu perustuen china telecomin itse kehittämään tianyi cloud "integrated intelligent computing service platformiin" ja tekoälyyrityksen "xinghai ai platformiin". tarkkuus, joka saavuttaa yli 93% gpu:n laskentatehosta samalla laskentateholla, kun taas mallin tehokas harjoitteluaika on yli 98%.

telechat2-115b:n avoin lähdekoodi merkitsee uutta matkaa suurten mallien lokalisoinnissa. ensimmäisenä valtion omistamana yrityksenä, joka on laatinut ja avoimen lähdekoodin suuria malleja, teleai edistää aktiivisesti suurten mallien teknologian jatkuvaa kehitystä avoimen lähdekoodin kautta ja edistää ja johtaa edelleen teknologisten innovaatioiden nopeaa siirtymistä teolliseen käyttöön.

tämän vuoden toukokuussa opencampass-testilistassa telechat-sarjan mallien looginen päättelykyky sijoittui ensimmäiseksi avoimen lähdekoodin suurten mallien listalla. uuden sukupolven versiona telechat2-115b sijoittui ensimmäiseksi 86,9 pisteellä uusimmassa c-eval-arvioinnin open access -mallien kattavassa luettelossa, joka julkaistiin syyskuussa. sen yleiset ominaisuudet ovat lähes 30 % korkeammat kuin telechat-sarjan malleilla, erityisesti työkalujen käytön, loogisen päättelyn, matemaattisten laskelmien, koodin generoinnin ja pitkän muotoisen kirjoittamisen suhteen.

telechat2-115b on ensimmäisellä sijalla c-evalin kattavassa open access -mallien luettelossa

on selvää, että teleai:n itse kehittämä suuri semanttinen malli on voittanut ensimmäisen sijan monissa arvovaltaisissa kilpailuissa. heidän joukossaan se voitti ensimmäisen sijan kiinalaisessa spatiaalisen semanttisen ymmärryksen arvioinnissa ja muinaisen kiinan historiallisen tapahtumatyypin poiminnan arvioinnissa ccl2024-konferenssissa. lisäksi hän voitti mestaruuden nlpcc2024 chinese argumentative paper mining (shared task5) challenge -haasteessa.

(tiedot)

raportti/palaute

uutiset

teleai suoritti ensimmäisen kansallisen tuotannon wanka wanganin suuren mallikoulutuksen, avoimen lähdekoodin telechat2-115b

johdanto

yhteystietoni