uutiset

360 iou päivitetty qifu iou:ksi qifu technologyn maailmanlaajuinen huippukonferenssi interspeech herätti kiivasta keskustelua, ja murteentunnistusteknologiasta tuli keskipiste.

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

äskettäin qifu technology kutsuttiin osallistumaan interspeech 2024 -konferenssiin, joka on suurin kansainvälinen puheviestintä- ja signaalinkäsittelykonferenssi, joka pidettiin kreikassa, ja julkaisi artikkelin qifusion-net: layer-adapted stream/non-stream model for end-to-end multi- accent speech recognitionin pääpuhe osoitti kattavasti sen saavutuksia puheentunnistusteknologian alalla ja asetti kiinan puheteknologialle uuden mittapuun globaalistua ja osallistua maailmanlaajuiseen kilpailuun.
kuva 1: qifu technology piti pääpuheen interspeech 2024 -konferenssissa
puheessa qifu technology esitteli uuden sukupolven qifu-puheentunnistusjärjestelmän "qifree", joka voi tukea yli 20 murretta samanaikaisesti. vertattaessa kespeechiä, arvovaltaista testisarjaa kiinan aksentin ja murteen puheentunnistuksen alalla, qifu technology luotti syvään kerryttymiseensa automaattisen puheentunnistuksen (asr) alalla saavuttaakseen merkittävän parannuksen murreaksenttiluokituksen tarkkuudessa. se saavutti 79,10 %, mikä ylittää selvästi kespeechin perustason 61,13 %. nämä tiedot heijastavat intuitiivisesti qifu technologyn erinomaista puheentunnistustarkkuutta. samaan aikaan tunnistusvirhesuhteen mittaavan avainindikaattorin - cer (character error rate, character error rate) - suhteen qifu technology saavutti 8,08 %, mikä on paljon parempi kuin kespeechin 10,38 %, mikä osoittaa sen suorituskykyä. kiinan murteen tunnistamisessa tehokkuus ja tarkkuus alalla.
taulukko 1: qifu technologyn "qifreen" ja kespeech baselinen suorituskykyvaikutusten vertailu
qifree technologyn itse kehittämä kiinalainen puheentunnistusjärjestelmä "qifree" katkaisee sen ongelman, että yksi malli pystyy tunnistamaan vain tietyn yksittäisen murteen innovatiivisen kerroksen mukautuvan fuusiorakenteen ja jaetun tiedon koodausmoduulin avulla se voi poimia murretietoja tehokkaammin ja saavuttaa. välitön käännös parantaa entisestään äänirobottien reaaliaikaisia ​​vuorovaikutusominaisuuksia. on syytä mainita, että "qifree" ei vain ylläpidä johtavaa asemaa cer:ssä mandariinien tunnistamisen alalla, vaan sillä on myös parempi tunnistuskyky useilla murrealueilla, kuten hebei-lu, jianghuai, jiao-liao, lan-yin jne. ., verrattuna parhaaseen menneisyyteen parhailla tuloksilla saavutettiin merkittävä, yli 15 % parannus.
on syytä mainita, että verrattuna ensiluokkaisiin kotimaisiin yrityksiin (kuten teknologiajätti ja kiinan vaikutusvaltaisin puheentunnistuksen avoimen lähdekoodin yhteisö), qifu technology osoitti myös ylivoimaisen edun. jopa silloin, kun vastustajat kohtaavat suuremman parametriasteikon ja monipuolisemman harjoitustiedon, qifu technology voi silti erottua alhaisemmalla cer:llä (8,08 % vs 15,61 % vs 26,55 %), mikä todistaa sen teknisen arkkitehtuurin ylivertaisuuden ja algoritmien optimoinnin tehokkuuden.
taulukko 2: qifu technologyn "qifreen" avainindikaattoreiden vertailu ensiluokkaisiin kotimaisiin ja ulkomaisiin teknologiayrityksiin
qifu technologyn jälleen upea esiintyminen interspeech 2024 -messuilla ei ole vain kattava esitys sen vuosien intensiivisestä työstä puheentunnistusteknologian alalla, vaan myös ilmoitus maailmalle kiinalaisten yritysten vahvasta kilpailukyvystä ja rajattomasta potentiaalista tällä alalla. potentiaalia. qifu technology johtaa murteentunnistusteknologian uutta kehityssuuntaa erinomaisella teknisellä vahvuudellaan ja innovatiivisella hengellään, mikä edistää kiinalaista viisautta ja kiinalaista voimaa maailmanlaajuisen puheviestintä- ja signaalinkäsittelytekniikan kehityksessä.
raportti/palaute