360 iou ditingkatkan menjadi qifu iou konferensi global teratas teknologi qifu interspeech menarik diskusi hangat, dan teknologi pengenalan dialek menjadi fokusnya
2024-09-27
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
baru-baru ini, qifu technology diundang untuk menghadiri interspeech 2024, konferensi komunikasi ucapan dan pemrosesan sinyal internasional terkemuka yang diadakan di yunani, dan menerbitkan makalah berjudul qifusion-net: model aliran/non-aliran yang diadaptasi lapisan untuk multi-arus end-to-end. pidato utama accent speech recognition secara komprehensif menunjukkan pencapaiannya di bidang teknologi pengenalan suara, menetapkan tolok ukur baru bagi teknologi ucapan tiongkok untuk mendunia dan berpartisipasi dalam kompetisi global.
gambar 1: teknologi qifu memberikan pidato utama pada konferensi interspeech 2024
dalam pidatonya, teknologi qifu memperkenalkan sistem pengenalan suara qifu generasi baru "qifree" yang dapat mendukung lebih dari 20 dialek secara bersamaan. dalam perbandingan kespeech, pengujian resmi yang dilakukan di bidang pengenalan aksen dan dialek tiongkok, teknologi qifu mengandalkan akumulasi mendalamnya di bidang pengenalan ucapan otomatis (asr) untuk mencapai peningkatan yang signifikan dalam akurasi klasifikasi aksen dialek, mencapai angka ini mencapai 79,10%, jauh melampaui tingkat dasar kespeech sebesar 61,13%. data ini secara intuitif mencerminkan kinerja luar biasa teknologi qifu dalam akurasi pengenalan suara. pada saat yang sama, dalam hal indikator utama untuk mengukur tingkat kesalahan pengenalan - cer (character error rate, tingkat kesalahan karakter), qifu technology mencapai skor 8,08%, jauh lebih baik daripada kespeech yang sebesar 10,38%, yang menunjukkan kinerjanya dalam pengenalan dialek cina. efisiensi dan presisi di lapangan.
tabel 1: perbandingan dampak kinerja “qifree” dan kespeech baseline dari teknologi qifu
sistem pengenalan ucapan berbahasa mandarin yang dikembangkan sendiri oleh qifree technology, "qifree", memecahkan dilema bahwa satu model hanya dapat mengenali satu dialek tertentu. melalui struktur fusi adaptif lapisan inovatif dan modul pengkodean informasi bersama, model tersebut dapat mengekstraksi informasi dialek dengan lebih efisien dan mencapai hasil terjemahan instan semakin meningkatkan kemampuan interaksi real-time robot suara. perlu disebutkan bahwa "qifree" tidak hanya mempertahankan posisi terdepan di cer dalam bidang pengenalan bahasa mandarin, namun juga memiliki kinerja pengenalan yang lebih baik di berbagai bidang dialek seperti hebei-lu, jianghuai, jiao-liao, lan-yin, dll. ., dibandingkan dengan hasil terbaik sebelumnya. hasil terbaik mencapai peningkatan yang signifikan lebih dari 15%.
perlu disebutkan bahwa dibandingkan dengan perusahaan domestik kelas satu (seperti raksasa teknologi dan komunitas open source pengenalan suara paling berpengaruh di tiongkok), qifu technology juga menunjukkan keunggulan yang luar biasa. bahkan ketika menghadapi lawan dengan skala parameter yang lebih besar dan data pelatihan yang lebih kaya, teknologi qifu masih dapat menonjol dengan cer yang lebih rendah (8,08% vs 15,61% vs 26,55%), membuktikan keunggulan arsitektur teknisnya dan efisiensi optimasi algoritma.
tabel 2: perbandingan indikator utama “qifree” teknologi qifu dengan perusahaan teknologi kelas satu dalam dan luar negeri
penampilan luar biasa qifu technology di interspeech 2024 tidak hanya menunjukkan kerja intensif qifu technology selama bertahun-tahun di bidang teknologi pengenalan suara, namun juga merupakan pernyataan kepada dunia akan daya saing yang kuat dan potensi tak terbatas dari perusahaan-perusahaan tiongkok di bidang ini. potensi. teknologi qifu memimpin tren perkembangan baru dalam teknologi pengenalan dialek dengan kekuatan teknisnya yang luar biasa dan semangat inovatif, menyumbangkan kearifan tiongkok dan kekuatan tiongkok terhadap kemajuan teknologi komunikasi suara dan pemrosesan sinyal global.