notizia

360 iou aggiornati a qifu iou la conferenza più importante della tecnologia qifu, interspeech, ha suscitato accese discussioni e la tecnologia di riconoscimento dei dialetti è diventata il focus

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

recentemente, qifu technology è stata invitata a partecipare a interspeech 2024, la principale conferenza internazionale sulla comunicazione vocale e sull'elaborazione del segnale tenutasi in grecia, e ha pubblicato un documento intitolato qifusion-net: layer-adapted stream/non-stream model for end-to-end multi- il discorso di apertura di accent speech recognition ha dimostrato in modo esauriente i suoi risultati nel campo della tecnologia di riconoscimento vocale, stabilendo un nuovo punto di riferimento per la tecnologia vocale cinese per diventare globale e partecipare alla competizione globale.
figura 1: qifu technology ha tenuto un discorso programmatico alla conferenza interspeech 2024
nel discorso, la tecnologia qifu ha introdotto il sistema di riconoscimento vocale qifu di nuova generazione "qifree" in grado di supportare più di 20 dialetti contemporaneamente. nel confronto tra kespeech, il test autorevole nel campo del riconoscimento vocale dell'accento e del dialetto cinese, la tecnologia qifu ha fatto affidamento sulla sua profonda accumulazione nel campo del riconoscimento vocale automatico (asr) per ottenere un miglioramento significativo nell'accuratezza della classificazione dell'accento dialettale, raggiungendo ha raggiunto il 79,10%, superando di gran lunga il livello di base di kespeech del 61,13%. questi dati riflettono in modo intuitivo le eccellenti prestazioni della tecnologia qifu in termini di precisione del riconoscimento vocale. allo stesso tempo, in termini di indicatore chiave per misurare il tasso di errore di riconoscimento - cer (character error rate, tasso di errore dei caratteri), la tecnologia qifu ha ottenuto un punteggio dell'8,08%, che è di gran lunga migliore del 10,38% di kespeech, dimostrando le sue prestazioni nel riconoscimento del dialetto cinese. efficienza e precisione sul campo.
tabella 1: confronto degli effetti sulle prestazioni di "qifree" della tecnologia qifu e kespeech baseline
il sistema di riconoscimento vocale cinese "qifree" sviluppato da qifree technology rompe il dilemma secondo cui un singolo modello può riconoscere solo un singolo dialetto specifico. attraverso un'innovativa struttura di fusione adattiva a strati e un modulo di codifica delle informazioni condivise, può estrarre le informazioni sul dialetto in modo più efficiente e ottenere risultati la traduzione istantanea migliora ulteriormente le capacità di interazione in tempo reale dei robot vocali. vale la pena ricordare che "qifree" non solo mantiene una posizione di leadership nel cer nel campo del riconoscimento del mandarino, ma ha anche prestazioni di riconoscimento migliori in più aree dialettali come hebei-lu, jianghuai, jiao-liao, lan-yin, ecc. ., rispetto ai migliori del passato i migliori risultati hanno ottenuto un miglioramento significativo di oltre il 15%.
vale la pena ricordare che rispetto alle aziende nazionali di prima classe (come un gigante della tecnologia e la comunità open source di riconoscimento vocale più influente in cina), anche la tecnologia qifu ha mostrato un vantaggio schiacciante. anche di fronte ad avversari con scale di parametri più ampie e dati di allenamento più ricchi, la tecnologia qifu può comunque distinguersi con un cer inferiore (8,08% contro 15,61% contro 26,55%), dimostrando la superiorità della sua architettura tecnica e l'efficienza dell'ottimizzazione dell'algoritmo.
tabella 2: confronto degli indicatori chiave di “qifree” di qifu technology con aziende tecnologiche nazionali ed estere di prima classe
la meravigliosa apparizione di qifu technology a interspeech 2024 non è solo una dimostrazione completa dei suoi anni di intenso lavoro nel campo della tecnologia di riconoscimento vocale, ma anche una dichiarazione al mondo della forte competitività e del potenziale illimitato delle imprese cinesi in questo campo. potenziale. la tecnologia qifu sta guidando una nuova tendenza di sviluppo nella tecnologia di riconoscimento dei dialetti con la sua eccezionale forza tecnica e spirito innovativo, contribuendo alla saggezza cinese e al potere cinese al progresso della comunicazione vocale globale e della tecnologia di elaborazione del segnale.
segnalazione/feedback