noticias

360 iou actualizado a qifu iou la principal conferencia mundial de qifu technology interspeech atrajo acaloradas discusiones y la tecnología de reconocimiento de dialectos se convirtió en el centro de atención

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

recientemente, qifu technology fue invitada a asistir a interspeech 2024, la principal conferencia internacional sobre comunicación de voz y procesamiento de señales celebrada en grecia, y publicó un artículo titulado qifusion-net: layer-adapted stream/non-stream model for end-to-end multi- el discurso de apertura de accent speech recognition demostró ampliamente sus logros en el campo de la tecnología de reconocimiento de voz, estableciendo un nuevo punto de referencia para que la tecnología de voz de china se globalice y participe en la competencia global.
figura 1: qifu technology pronunció un discurso de apertura en la conferencia interspeech 2024
en el discurso, qifu technology presentó el sistema de reconocimiento de voz qifu de nueva generación "qifree" que puede admitir más de 20 dialectos al mismo tiempo. en comparación con kespeech, la prueba autorizada establecida en el campo del reconocimiento de voz dialectal y acento chino, la tecnología qifu se basó en su profunda acumulación en el campo del reconocimiento automático de voz (asr) para lograr una mejora significativa en la precisión de la clasificación del acento dialectal, alcanzando logró un 79,10 %, superando con creces el nivel básico de kespeech de 61,13 %. estos datos reflejan intuitivamente el excelente rendimiento de la tecnología qifu en precisión de reconocimiento de voz. al mismo tiempo, en términos del indicador clave para medir la tasa de error de reconocimiento: cer (character error rate, tasa de error de caracteres), qifu technology logró una puntuación del 8,08%, mucho mejor que el 10,38% de kespeech, lo que demuestra su rendimiento. en el reconocimiento del dialecto chino. eficiencia y precisión en el campo.
tabla 1: comparación de los efectos en el rendimiento de “qifree” y kespeech baseline de qifu technology
el sistema de reconocimiento de voz chino de desarrollo propio de qifree technology, "qifree", rompe el dilema de que un solo modelo solo puede reconocer un dialecto específico. a través de una innovadora estructura de fusión adaptativa de capas y un módulo de codificación de información compartida, puede extraer información del dialecto de manera más eficiente y lograrlo. la traducción instantánea mejora aún más las capacidades de interacción en tiempo real de los robots de voz. vale la pena mencionar que "qifree" no solo mantiene una posición de liderazgo en cer en el campo del reconocimiento de mandarín, sino que también tiene un mejor rendimiento de reconocimiento en múltiples áreas dialectales como hebei-lu, jianghuai, jiao-liao, lan-yin, etc. ., en comparación con los mejores del pasado. los mejores resultados lograron una mejora significativa de más del 15%.
vale la pena mencionar que, en comparación con empresas nacionales de primera clase (como un gigante tecnológico y la comunidad de código abierto de reconocimiento de voz más influyente de china), qifu technology también mostró una ventaja abrumadora. incluso cuando se enfrenta a oponentes con escalas de parámetros más grandes y datos de entrenamiento más ricos, qifu technology aún puede destacarse con un cer más bajo (8,08 % frente a 15,61 % frente a 26,55 %), lo que demuestra la superioridad de su arquitectura técnica y la eficiencia de la optimización del algoritmo.
tabla 2: comparación de indicadores clave de “qifree” de qifu technology con empresas de tecnología nacionales y extranjeras de primera clase
la maravillosa aparición una vez más de qifu technology en interspeech 2024 no es solo una muestra completa de sus años de trabajo intensivo en el campo de la tecnología de reconocimiento de voz, sino también una declaración al mundo de la fuerte competitividad y el potencial ilimitado de las empresas chinas en este campo. potencial. qifu technology está liderando una nueva tendencia de desarrollo en la tecnología de reconocimiento de dialectos con su destacada fortaleza técnica y espíritu innovador, contribuyendo con la sabiduría y el poder chinos al avance de la comunicación de voz global y la tecnología de procesamiento de señales.
informe/comentarios