uutiset

Moore-säie avoimen lähdekoodin äänen ymmärtäminen suuren mallin MooER: koulutus ja päätelmät perustuvat kotimaiseen täysin varustellun GPU: hun

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House raportoi 23. elokuuta, että MooER on avannut avoimen lähdekoodin laajan äänen ymmärtämismallin - MooER:n, joka on alan ensimmäinen laajamittainen avoimen lähdekoodin puhemalli, joka perustuu kotimaisiin täysimittaisiin GPU:ihin koulutusta ja päättelyä varten.

Moore Thread Kuae (KUAE) -älykkääseen laskenta-alustaan ​​perustuva MooER-suurmalli suoritti 5 000 tunnin äänidatan ja pseudomerkintöjen koulutuksen 38 tunnissa.

MooER ei tue vain kiinan ja englannin puheentunnistusta, vaan sillä on myös puheen käännösominaisuudet kiinasta englanniksi. Covost2-kiina-englanti-käännöstestissä MooER-5K saavutti BLEU-pistemäärän 25,2, mikä on lähellä teollisuustason tuloksia.

Moore Thread AI -tiimi on hankkinut avoimen lähdekoodin päättelykoodin ja mallin, joka on koulutettu 5 000 tunnin dataan tässä työssä, ja aikoo jatkaa avoimen lähdekoodin harjoittelukoodia ja mallia, joka on koulutettu 80 000 tunnin dataan.

MooER:n mallirakenne sisältää kolme osaa: Encoder, Adapter ja Decoder (Large Language Model, LLM).