nouvelles

360 iou sont devenus qifu iou la plus grande conférence mondiale de qifu technology, interspeech, a suscité des discussions animées et la technologie de reconnaissance dialectale est devenue le centre d'intérêt

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

récemment, qifu technology a été invitée à interspeech 2024, la plus grande conférence internationale sur la communication vocale et le traitement du signal qui s'est tenue en grèce, et a publié un article intitulé qifusion-net : layer-adapted stream/non-stream model for end-to-end multi- le discours d'ouverture d'accent speech recognition a démontré de manière exhaustive ses réalisations dans le domaine de la technologie de reconnaissance vocale, établissant ainsi une nouvelle référence pour que la technologie vocale chinoise puisse se mondialiser et participer à la concurrence mondiale.
figure 1 : qifu technology a prononcé un discours lors de la conférence interspeech 2024
dans son discours, qifu technology a présenté le système de reconnaissance vocale qifu de nouvelle génération « qifree » qui peut prendre en charge plus de 20 dialectes en même temps. dans la comparaison de kespeech, le test faisant autorité dans le domaine de la reconnaissance vocale de l'accent chinois et du dialecte, qifu technology s'est appuyée sur sa profonde accumulation dans le domaine de la reconnaissance automatique de la parole (asr) pour obtenir une amélioration significative de la précision de la classification des accents dialectaux, atteignant il a atteint 79,10 %, dépassant de loin le niveau de référence de kespeech de 61,13 %. ces données reflètent intuitivement les excellentes performances de qifu technology en matière de précision de reconnaissance vocale. dans le même temps, en ce qui concerne l'indicateur clé pour mesurer le taux d'erreur de reconnaissance - cer (character error rate, taux d'erreur de caractère), qifu technology a obtenu un score de 8,08 %, bien meilleur que les 10,38 % de kespeech, démontrant sa performance. en reconnaissance du dialecte chinois. efficacité et précision sur le terrain.
tableau 1 : comparaison des effets sur les performances de « qifree » et de kespeech baseline de la technologie qifu
le système de reconnaissance vocale chinoise « qifree » développé par qifree technology élimine le dilemme selon lequel un modèle unique ne peut reconnaître qu'un seul dialecte spécifique. grâce à une structure de fusion adaptative de couche innovante et à un module de codage d'informations partagé, il peut extraire les informations dialectales plus efficacement et les réaliser. la traduction instantanée améliore encore les capacités d'interaction en temps réel des robots vocaux. il convient de mentionner que « qifree » maintient non seulement une position de leader en cer dans le domaine de la reconnaissance du mandarin, mais a également de meilleures performances de reconnaissance dans plusieurs domaines dialectaux tels que hebei-lu, jianghuai, jiao-liao, lan-yin, etc. ., par rapport aux meilleurs du passé. les meilleurs résultats ont permis une amélioration significative de plus de 15 %.
il convient de mentionner que par rapport aux entreprises nationales de premier ordre (telles qu'un géant de la technologie et la communauté open source de reconnaissance vocale la plus influente de chine), qifu technology a également montré un avantage écrasant. même face à des adversaires dotés d'échelles de paramètres plus grandes et de données d'entraînement plus riches, la technologie qifu peut toujours se démarquer avec un cer inférieur (8,08 % contre 15,61 % contre 26,55 %), prouvant la supériorité de son architecture technique et l'efficacité de l'optimisation des algorithmes.
tableau 2 : comparaison des indicateurs clés de « qifree » de qifu technology avec des entreprises technologiques nationales et étrangères de premier ordre
la merveilleuse apparition de qifu technology à interspeech 2024 n'est pas seulement une démonstration complète de ses années de travail intensif dans le domaine de la technologie de reconnaissance vocale, mais aussi une déclaration au monde de la forte compétitivité et du potentiel illimité des entreprises chinoises dans ce domaine. potentiel. qifu technology est à la tête d'une nouvelle tendance de développement dans la technologie de reconnaissance dialectale grâce à sa force technique exceptionnelle et son esprit d'innovation, contribuant ainsi à la sagesse et à la puissance chinoises à l'avancement de la technologie mondiale de communication vocale et de traitement du signal.
rapport/commentaires