Moore thread audio sumber terbuka memahami model besar MooER: pelatihan dan inferensi berdasarkan GPU

Moore thread audio sumber terbuka memahami model besar MooER: pelatihan dan inferensi berdasarkan GPU berfitur lengkap dalam negeri

2024-08-24

IT House melaporkan pada tanggal 23 Agustus bahwa MooER telah membuat model pemahaman audio besar menjadi sumber terbuka - MooER, yang merupakan model ucapan sumber terbuka skala besar pertama di industri berdasarkan GPU berfitur lengkap dalam negeri untuk pelatihan dan inferensi.

Berdasarkan platform komputasi cerdas Moore Thread Kuae (KUAE), model besar MooER menyelesaikan pelatihan 5.000 jam data audio dan label semu dalam 38 jam.

MooER tidak hanya mendukung pengenalan ucapan berbahasa Mandarin dan Inggris, tetapi juga memiliki kemampuan terjemahan ucapan dari Mandarin ke Inggris. Pada set tes terjemahan Mandarin-Inggris Covost2, MooER-5K mencapai skor BLEU sebesar 25,2, yang mendekati hasil tingkat industri.

Tim AI Moore Thread telah membuka kode inferensi dan model yang dilatih pada 5.000 jam data dalam pekerjaan ini, dan berencana untuk lebih membuka kode pelatihan dan model yang dilatih pada 80.000 jam data.

Struktur model MooER mencakup tiga bagian: Encoder, Adapter dan Decoder (Large Language Model, LLM). Skala parameter model spesifiknya adalah sebagai berikut:

berita

Moore thread audio sumber terbuka memahami model besar MooER: pelatihan dan inferensi berdasarkan GPU berfitur lengkap dalam negeri

Perkenalan

Informasi kontak saya