Moore thread ανοιχτού κώδικα κατανόησης ήχου μεγάλου μοντέλου MooER: εκπαίδευση και συμπέρασμα βάσει εγχώριων GPU

Moore thread ανοιχτού κώδικα κατανόησης ήχου μεγάλου μοντέλου MooER: εκπαίδευση και συμπέρασμα βασισμένο σε εγχώρια πλήρως εξοπλισμένη GPU

2024-08-24

Το IT House ανέφερε στις 23 Αυγούστου ότι το MooER έχει ανοιχτού κώδικα ένα μεγάλο μοντέλο κατανόησης ήχου - το MooER, το οποίο είναι το πρώτο μεγάλης κλίμακας μοντέλο ομιλίας ανοιχτού κώδικα του κλάδου που βασίζεται σε εγχώριες GPU με πλήρη χαρακτηριστικά για εκπαίδευση και εξαγωγή συμπερασμάτων.

Βασισμένο στην ευφυή υπολογιστική πλατφόρμα Moore Thread Kuae (KUAE), το μεγάλο μοντέλο MooER ολοκλήρωσε την εκπαίδευση 5.000 ωρών δεδομένων ήχου και ψευδο-ετικέτες σε 38 ώρες.

Το MooER όχι μόνο υποστηρίζει την Κινεζική και Αγγλική αναγνώριση ομιλίας, αλλά διαθέτει και δυνατότητες μετάφρασης ομιλίας από τα κινέζικα στα αγγλικά. Στο σετ δοκιμής μετάφρασης Κινεζικών-Αγγλικών Covost2, το MooER-5K πέτυχε βαθμολογία BLEU 25,2, η οποία είναι κοντά στα αποτελέσματα βιομηχανικού επιπέδου.

Η ομάδα Τεχνητής Νοημοσύνης του Moore Thread έχει ανοιχτού κώδικα τον κώδικα συμπερασμάτων και το μοντέλο που έχει εκπαιδευτεί σε 5.000 ώρες δεδομένων σε αυτήν την εργασία και σχεδιάζει να αναπτύξει περαιτέρω τον κώδικα εκπαίδευσης και το μοντέλο που έχει εκπαιδευτεί σε 80.000 ώρες δεδομένων.

Η δομή του μοντέλου του MooER περιλαμβάνει τρία μέρη: Κωδικοποιητής, Προσαρμογέας και Αποκωδικοποιητής (Large Language Model, LLM).

νέα

Moore thread ανοιχτού κώδικα κατανόησης ήχου μεγάλου μοντέλου MooER: εκπαίδευση και συμπέρασμα βασισμένο σε εγχώρια πλήρως εξοπλισμένη GPU

Εισαγωγή

Τα στοιχεία επικοινωνίας μου