teleai ha completato la formazione del primo modello su larga scala di wanka wangan prodotto a livello nazionale e open source telechat2-115b

teleai ha completato la prima produzione nazionale di formazione sul modello di grandi dimensioni wanka wangan, telechat2-115b open source

2024-09-29

recentemente, il china telecom artificial intelligence research institute (denominato: teleai) ha completato con successo il primo modello di grandi dimensioni da trilioni di parametri in cina basato sul training cluster wanka prodotto a livello nazionale (denominato: wanka wancan), e ha reso ufficialmente open source il primo a livello nazionale. modello prodotto basato sul cluster wanka prodotto a livello nazionale, un modello di grandi dimensioni con centinaia di miliardi di parametri addestrati dal cluster huawanka e dal framework di deep learning domestico, è un grande modello di star semantics.

questa è un’altra pietra miliare e un importante risultato della ricerca scientifica guidata dal professor li xuelong, cto, capo scienziato del china telecom group e preside del china telecom artificial intelligence research institute. indica che la formazione su modelli nazionali su larga scala ha davvero realizzato la sostituzione della nazionalizzazione ed è entrato ufficialmente nel mercato una nuova fase di innovazione indipendente, sicurezza e controllabilità per la produzione nazionale.

telechat2-115b è stato addestrato sulla base della "piattaforma di servizi di elaborazione intelligente integrata" tianyi cloud sviluppata autonomamente da china telecom e della "piattaforma ai xinghai" della società di intelligenza artificiale. utilizza una varietà di metodi di ottimizzazione per migliorare l'efficienza e la precisione dell'addestramento dei modelli garantendo al contempo la formazione precisione. stabilità, raggiungendo oltre il 93% dell'efficienza di calcolo della gpu con la stessa potenza di calcolo, mentre il tempo di addestramento effettivo del modello rappresenta oltre il 98%.

l'open source di telechat2-115b segna un altro nuovo viaggio per la localizzazione di modelli di grandi dimensioni. essendo la prima impresa statale a predisporre e rendere open source modelli di grandi dimensioni, teleai promuove attivamente il progresso continuo della tecnologia dei modelli di grandi dimensioni attraverso l'open source e continua a promuovere e guidare la rapida transizione dall'innovazione tecnologica all'implementazione industriale.

nell'elenco dei test opencampass del maggio di quest'anno, le capacità di ragionamento logico dei modelli della serie telechat si sono classificate al primo posto nell'elenco dei grandi modelli open source. essendo una versione di nuova generazione, telechat2-115b si è classificata al primo posto con un punteggio di 86,9 punti nell'ultimo elenco completo del modello di valutazione open access di c-eval pubblicato a settembre. le sue capacità generali sono superiori di quasi il 30% rispetto a quelle dei modelli della serie telechat, soprattutto in termini di utilizzo degli strumenti, ragionamento logico, calcoli matematici, generazione di codice e scrittura di lunga durata.

telechat2-115b è al primo posto nell'elenco completo dei modelli ad accesso aperto di c-eval

resta inteso che il grande modello semantico auto-sviluppato di teleai ha vinto il primo posto in molti concorsi autorevoli. tra questi, ha vinto il primo posto nella valutazione della comprensione semantica spaziale cinese e nella valutazione dell'estrazione del tipo di evento storico cinese antico alla conferenza ccl2024. inoltre, ha vinto il campionato nella sfida nlpcc2024 chinese argumentative paper mining (shared task5).

(informazioni)

segnalazione/feedback

notizia

teleai ha completato la prima produzione nazionale di formazione sul modello di grandi dimensioni wanka wangan, telechat2-115b open source

introduzione

le mie informazioni di contatto