новости

360 iou повышен до qifu iou ведущая глобальная конференция qifu technology interspeech вызвала бурные дискуссии, и в центре внимания оказалась технология распознавания диалектов.

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

недавно компания qifu technology была приглашена на interspeech 2024, ведущую международную конференцию по речевой коммуникации и обработке сигналов, проходившую в греции, и опубликовала документ под названием qifusion-net: адаптированная к уровню потоковая/непотоковая модель для сквозной многоканальной передачи данных. в своей основной речи компания accent speech recognition всесторонне продемонстрировала свои достижения в области технологий распознавания речи, установив новый стандарт для китайских речевых технологий, которые смогут выйти на глобальный уровень и участвовать в глобальной конкуренции.
рисунок 1. компания qifu technology выступила с программной речью на конференции interspeech 2024.
в своем выступлении компания qifu technology представила систему распознавания речи qifu нового поколения «qifree», которая может поддерживать более 20 диалектов одновременно. при сравнении kespeech, авторитетного набора тестов в области распознавания китайского акцента и диалектной речи, компания qifu technology опиралась на свой глубокий опыт в области автоматического распознавания речи (asr), чтобы добиться значительного улучшения точности классификации диалектного акцента, достигнув он достиг 79,10%, что намного превышает базовый уровень kespeech в 61,13%. эти данные интуитивно отражают превосходные показатели qifu technology в области точности распознавания речи. в то же время, по ключевому показателю для измерения частоты ошибок распознавания - cer (character error rate, частота ошибок в символах), qifu technology достигла показателя 8,08%, что намного лучше, чем 10,38% у kespeech, продемонстрировав свою производительность. в распознавании китайского диалекта. эффективность и точность в полевых условиях.
таблица 1. сравнение влияния на производительность «qifree» от qifu technology и базового уровня kespeech
система распознавания китайской речи «qifree», разработанная компанией qifree technology, решает дилемму, заключающуюся в том, что одна модель может распознавать только один конкретный диалект. благодаря инновационной многоуровневой адаптивной структуре слияния и общему модулю кодирования информации она может более эффективно извлекать информацию о диалекте и достигать результатов. мгновенный перевод еще больше расширяет возможности взаимодействия голосовых роботов в реальном времени. стоит отметить, что «qifree» не только сохраняет лидирующие позиции в cer в области распознавания китайского языка, но также имеет более высокие показатели распознавания в нескольких диалектных регионах, таких как хэбэй-лу, цзянхуай, цзяо-ляо, лань-инь и т. д. ., по сравнению с лучшими в прошлом. лучшие результаты достигли значительного улучшения более чем на 15%.
стоит отметить, что по сравнению с первоклассными отечественными компаниями (такими как технологический гигант и самое влиятельное сообщество открытого исходного кода распознавания речи в китае), qifu technology также показала подавляющее преимущество. даже сталкиваясь с противниками с более крупными масштабами параметров и более богатыми тренировочными данными, qifu technology по-прежнему может выделяться более низким cer (8,08% против 15,61% против 26,55%), доказывая превосходство своей технической архитектуры и эффективности оптимизации алгоритма.
таблица 2: сравнение ключевых показателей «qifree» компании qifu technology с первоклассными отечественными и зарубежными технологическими компаниями
очередное замечательное появление qifu technology на interspeech 2024 — это не только всесторонняя демонстрация многолетней интенсивной работы в области технологий распознавания речи, но и декларация миру о высокой конкурентоспособности и неограниченном потенциале китайских предприятий в этой области. потенциал. qifu technology возглавляет новую тенденцию развития технологий распознавания диалектов благодаря своей выдающейся технической мощи и инновационному духу, внося китайскую мудрость и китайскую силу в развитие глобальной голосовой связи и технологий обработки сигналов.
отчет/отзыв