Détection et correction automatique des erreurs de reconnaissance vocale : un examen

##plugins.themes.bootstrap3.article.main##

Rahhal Errattahi
Asmaa El Hannani
Hassan

Résumé

Même si la reconnaissance automatique de la parole (ASR) a atteint le stade des applications commerciales, le taux d'erreur élevé dans certains domaines de la reconnaissance vocale reste l'un des principaux facteurs entravant l'adoption à grande échelle de la technologie vocale, et en particulier pour les applications continues de reconnaissance vocale à large vocabulaire. . La présence persistante d’erreurs ASR a intensifié la nécessité de trouver des techniques alternatives pour détecter et corriger automatiquement ces erreurs. La correction des erreurs de transcription est cruciale non seulement pour améliorer la précision de la reconnaissance vocale, mais également pour éviter la propagation des erreurs aux modules de traitement linguistique ultérieurs tels que la traduction automatique. Dans cet article, les principes de base de l’évaluation ASR sont d’abord résumés, puis l’état de la recherche actuelle sur la détection et la correction des erreurs ASR est passé en revue. Nous nous concentrons sur les techniques émergentes utilisant la mesure du taux d’erreur sur les mots.

##plugins.themes.bootstrap3.article.details##

Comment citer
Errattahi, R., El Hannani, A., & Hassan. (2016). Détection et correction automatique des erreurs de reconnaissance vocale : un examen. AL-Lisaniyyat, 22(2), 40-43. https://doi.org/10.61850/allj.v22i2.372
Rubrique
Articles

Références

HTK Hidden Markov Model Toolkit , Speech recognition Toolkit avalaible at : hhtp://www.htk.eng.cam.ac.uk.
ITU-T Recommandation G.729, Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction CS-ACELP ,1996.
H.Yong, Z.Jiang ,Imlementation of ITU-T G729 Speech Code in IP Telephony Gateway ,Wuhan university Journal of natural sciences , vol.5, pp.159-163,2000.
B.Milner ,B, Semmani ,Robust speech Recognition Over Networks, IEEE International Conference Acoustics,Speech , And signal processing, pp.1791-1794, vol.3,2000.
Recommandation UIT-T G.711 , A high quality low-complexity algorithm for packet loss concealment with G.711, September 1999.
J.Wiley , Volp voice and fax signal processing , published simultaneously in Canada ,p.592,2008.
K.Nakamura, An Improvement ofG.711 PLC Using sinusoidal model proceedings of the IEEE The International conference on computer as a toll,pp.1670-1673,2005.
P.C.X. Sommen and J.A.K.S. Jayasinghe, On Frequency Domain Adaptive Filters using the Overlap-add Method , IEEE Philips Research Laboraories,pp.28-30,1988.