360 iou atualizado para qifu iou a principal conferência global da qifu technology, interspeech, atraiu discussões acaloradas e a tecnologia de reconhecimento de dialeto tornou-se o foco
2024-09-27
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
recentemente, a qifu technology foi convidada para participar da interspeech 2024, a principal conferência internacional de comunicação de voz e processamento de sinais realizada na grécia, e publicou um artigo intitulado qifusion-net: layer-adapted stream/non-stream model for end-to-end multi- o discurso principal da accent speech recognition demonstrou de forma abrangente suas conquistas no campo da tecnologia de reconhecimento de fala, estabelecendo um novo padrão para que a tecnologia de fala da china se torne global e participe da competição global.
figura 1: qifu technology fez um discurso de abertura na conferência interspeech 2024
no discurso, a qifu technology apresentou o sistema de reconhecimento de fala qifu de nova geração "qifree" que pode suportar mais de 20 dialetos ao mesmo tempo. na comparação do kespeech, o teste confiável definido no campo de sotaque chinês e reconhecimento de fala de dialeto, a qifu technology confiou em seu profundo acúmulo no campo de reconhecimento automático de fala (asr) para alcançar uma melhoria significativa na precisão da classificação de sotaque de dialeto, alcançando atingiu 79,10%, excedendo em muito o nível básico do kespeech de 61,13%. esses dados refletem intuitivamente o excelente desempenho da qifu technology na precisão do reconhecimento de fala. ao mesmo tempo, em termos do indicador-chave para medir a taxa de erro de reconhecimento - cer (taxa de erro de caractere, taxa de erro de caractere), a qifu technology alcançou uma pontuação de 8,08%, que é muito melhor que os 10,38% do kespeech, demonstrando seu desempenho no reconhecimento do dialeto chinês. eficiência e precisão no campo.
tabela 1: comparação dos efeitos de desempenho do “qifree” da tecnologia qifu e da linha de base kespeech
o sistema de reconhecimento de fala chinês "qifree" desenvolvido pela qifree technology quebra o dilema de que um único modelo só pode reconhecer um único dialeto específico. por meio de uma estrutura de fusão adaptativa de camada inovadora e um módulo de codificação de informações compartilhadas, ele pode extrair informações do dialeto com mais eficiência e alcançar. a tradução instantânea aprimora ainda mais os recursos de interação em tempo real dos robôs de voz. vale ressaltar que "qifree" não apenas mantém uma posição de liderança em cer na área de reconhecimento de mandarim, mas também tem melhor desempenho de reconhecimento em áreas de múltiplos dialetos, como hebei-lu, jianghuai, jiao-liao, lan-yin, etc. ., em comparação com os melhores resultados do passado. os melhores resultados alcançaram uma melhoria significativa de mais de 15%.
vale ressaltar que, em comparação com empresas nacionais de primeira classe (como uma gigante da tecnologia e a comunidade de código aberto de reconhecimento de fala mais influente da china), a qifu technology também mostrou uma vantagem esmagadora. mesmo enfrentando oponentes com escalas de parâmetros maiores e dados de treinamento mais ricos, a qifu technology ainda consegue se destacar com um cer menor (8,08% vs 15,61% vs 26,55%), comprovando a superioridade de sua arquitetura técnica e eficiência de otimização de algoritmo.
tabela 2: comparação dos principais indicadores do “qifree” da qifu technology com empresas de tecnologia nacionais e estrangeiras de primeira classe
a mais uma vez maravilhosa aparição da qifu technology na interspeech 2024 não é apenas uma demonstração abrangente dos seus anos de trabalho intensivo no campo da tecnologia de reconhecimento de voz, mas também uma declaração ao mundo da forte competitividade e do potencial ilimitado das empresas chinesas neste campo. potencial. a qifu technology está liderando uma nova tendência de desenvolvimento na tecnologia de reconhecimento de dialetos com sua notável força técnica e espírito inovador, contribuindo com a sabedoria chinesa e o poder chinês para o avanço da comunicação de voz global e da tecnologia de processamento de sinais.