νέα

360 iou αναβαθμίστηκαν σε qifu iou το κορυφαίο παγκόσμιο συνέδριο interspeech της τεχνολογίας qifu προσέλκυσε έντονες συζητήσεις και η τεχνολογία αναγνώρισης διαλέκτων έγινε στο επίκεντρο

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

πρόσφατα, η qifu technology προσκλήθηκε να παρακολουθήσει το interspeech 2024, το κορυφαίο διεθνές συνέδριο επικοινωνίας ομιλίας και επεξεργασίας σήματος που πραγματοποιήθηκε στην ελλάδα, και δημοσίευσε μια εργασία με τίτλο qifusion-net: layer-adapted stream/non-stream model for end-to-end multi- η κεντρική ομιλία του accent speech recognition κατέδειξε εκτενώς τα επιτεύγματά του στον τομέα της τεχνολογίας αναγνώρισης ομιλίας, θέτοντας ένα νέο σημείο αναφοράς για την παγκόσμια τεχνολογία ομιλίας της κίνας και τη συμμετοχή σε παγκόσμιο ανταγωνισμό.
εικόνα 1: η τεχνολογία qifu έδωσε μια κεντρική ομιλία στο συνέδριο interspeech 2024
στην ομιλία, η qifu technology παρουσίασε το σύστημα αναγνώρισης ομιλίας qifu νέας γενιάς «qifree» που μπορεί να υποστηρίξει περισσότερες από 20 διαλέκτους ταυτόχρονα. στη σύγκριση του kespeech, του έγκυρου τεστ στον τομέα της αναγνώρισης ομιλίας κινεζικής προφοράς και διαλέκτου, η τεχνολογία qifu βασίστηκε στη βαθιά συσσώρευσή της στον τομέα της αυτόματης αναγνώρισης ομιλίας (asr) για να επιτύχει σημαντική βελτίωση στην ακρίβεια ταξινόμησης προφοράς διαλέκτου, φτάνοντας πέτυχε 79,10%, ξεπερνώντας κατά πολύ το βασικό επίπεδο του kespeech του 61,13%. αυτά τα δεδομένα αντικατοπτρίζουν διαισθητικά την εξαιρετική απόδοση της τεχνολογίας qifu στην ακρίβεια αναγνώρισης ομιλίας. ταυτόχρονα, όσον αφορά τον βασικό δείκτη για τη μέτρηση του ποσοστού σφαλμάτων αναγνώρισης - cer (character error rate, character error rate), η qifu technology πέτυχε βαθμολογία 8,08%, που είναι πολύ καλύτερη από το 10,38% της kespeech, αποδεικνύοντας την απόδοσή της στην αναγνώριση κινεζικής διαλέκτου αποτελεσματικότητα και ακρίβεια στο πεδίο.
πίνακας 1: σύγκριση των αποτελεσμάτων απόδοσης του «qifree» και του kespeech baseline της τεχνολογίας qifu
το αυτο-αναπτυγμένο κινεζικό σύστημα αναγνώρισης ομιλίας "qifree" της qifree λύνει το δίλημμα ότι ένα μεμονωμένο μοντέλο μπορεί να αναγνωρίσει μόνο μια συγκεκριμένη μεμονωμένη διάλεκτο μέσω μιας καινοτόμου δομής προσαρμοστικής σύντηξης επιπέδου και μιας μονάδας κωδικοποίησης κοινών πληροφοριών, μπορεί να εξάγει πληροφορίες διαλέκτου πιο αποτελεσματικά και να επιτύχει. η άμεση μετάφραση ενισχύει περαιτέρω τις δυνατότητες αλληλεπίδρασης σε πραγματικό χρόνο των ρομπότ φωνής. αξίζει να αναφέρουμε ότι το "qifree" όχι μόνο διατηρεί ηγετική θέση στο cer στον τομέα της αναγνώρισης mandarin, αλλά έχει και καλύτερες επιδόσεις αναγνώρισης σε περιοχές πολλαπλών διαλέκτων όπως hebei-lu, jianghuai, jiao-liao, lan-yin κ.λπ. ., σε σύγκριση με τα καλύτερα στο παρελθόν τα καλύτερα αποτελέσματα πέτυχαν σημαντική βελτίωση άνω του 15%.
αξίζει να αναφερθεί ότι σε σύγκριση με εγχώριες εταιρείες πρώτης κατηγορίας (όπως ένας τεχνολογικός γίγαντας και η πιο σημαντική κοινότητα ανοιχτού κώδικα αναγνώρισης ομιλίας στην κίνα), η τεχνολογία qifu έδειξε επίσης ένα συντριπτικό πλεονέκτημα. ακόμη και όταν αντιμετωπίζετε αντιπάλους με μεγαλύτερες κλίμακες παραμέτρων και πιο πλούσια δεδομένα προπόνησης, η τεχνολογία qifu μπορεί να ξεχωρίσει με χαμηλότερο cer (8,08% έναντι 15,61% έναντι 26,55%), αποδεικνύοντας την ανωτερότητα της τεχνικής αρχιτεκτονικής της και την αποτελεσματικότητα βελτιστοποίησης αλγορίθμων.
πίνακας 2: σύγκριση βασικών δεικτών του «qifree» της qifu technology με εγχώριες και ξένες εταιρείες τεχνολογίας πρώτης κατηγορίας
η θαυμάσια εμφάνιση της qifu technology για άλλη μια φορά στο interspeech 2024 δεν είναι μόνο μια περιεκτική παρουσίαση της εντατικής εργασίας πολλών ετών στον τομέα της τεχνολογίας αναγνώρισης ομιλίας, αλλά και μια δήλωση στον κόσμο της ισχυρής ανταγωνιστικότητας και των απεριόριστων δυνατοτήτων των κινεζικών επιχειρήσεων σε αυτόν τον τομέα. δυνητικός. η qifu technology ηγείται μιας νέας τάσης ανάπτυξης στην τεχνολογία αναγνώρισης διαλέκτων με την εξαιρετική τεχνική της δύναμη και το καινοτόμο πνεύμα της, συμβάλλοντας στην κινεζική σοφία και την κινεζική ισχύ στην πρόοδο της παγκόσμιας τεχνολογίας φωνητικής επικοινωνίας και επεξεργασίας σήματος.
αναφορά/σχόλια