Moore thread audio open source che comprende il modello di grandi dimensioni MooER: formazione e inferenza basati su GPU

Moore thread audio open source che comprende il modello di grandi dimensioni MooER: formazione e inferenza basati su GPU domestica completa di funzionalità

2024-08-24

IT House ha riferito il 23 agosto che MooER ha reso open source un ampio modello di comprensione audio: MooER, che è il primo modello vocale open source su larga scala del settore basato su GPU domestiche complete di funzionalità per l'addestramento e l'inferenza.

Basato sulla piattaforma informatica intelligente Moore Thread Kuae (KUAE), il modello di grandi dimensioni MooER ha completato l'addestramento di 5.000 ore di dati audio e pseudo-etichette in 38 ore.

MooER non solo supporta il riconoscimento vocale cinese e inglese, ma ha anche funzionalità di traduzione vocale dal cinese all'inglese. Nel set di test di traduzione cinese-inglese Covost2, MooER-5K ha ottenuto un punteggio BLEU di 25,2, vicino ai risultati di livello industriale.

Il team AI di Moore Thread ha reso open source il codice di inferenza e il modello addestrato su 5.000 ore di dati in questo lavoro e prevede di rendere ulteriormente open source il codice di addestramento e il modello addestrato su 80.000 ore di dati.

La struttura del modello di MooER comprende tre parti: codificatore, adattatore e decodificatore (Large Language Model, LLM). La scala dei parametri del modello specifico è la seguente:

notizia

Moore thread audio open source che comprende il modello di grandi dimensioni MooER: formazione e inferenza basati su GPU domestica completa di funzionalità

Introduzione

Le mie informazioni di contatto