Automatic Speech Recognition Errors Detection And Correction: A Review

Rahhal Errattahi; Asmaa El Hannani; Hassan

doi:10.61850/allj.v22i2.372

pdf (English)

Publié-e : mai 30, 2016

DOI : https://doi.org/10.61850/allj.v22i2.372

Mots-clés :

Reconnaissance vocale automatique - Détection d'erreur ASR - Correction d'erreur ASR - Évaluation ASR

Rahhal Errattahi

Université de Chouaib Doukkali El Jadida

Asmaa El Hannani

Université de Chouaib Doukkali El Jadida

Hassan

Université de Chouaib Doukkali El Jadida

Résumé

Même si la reconnaissance automatique de la parole (ASR) a atteint le stade des applications commerciales, le taux d'erreur élevé dans certains domaines de la reconnaissance vocale reste l'un des principaux facteurs entravant l'adoption à grande échelle de la technologie vocale, et en particulier pour les applications continues de reconnaissance vocale à large vocabulaire. . La présence persistante d’erreurs ASR a intensifié la nécessité de trouver des techniques alternatives pour détecter et corriger automatiquement ces erreurs. La correction des erreurs de transcription est cruciale non seulement pour améliorer la précision de la reconnaissance vocale, mais également pour éviter la propagation des erreurs aux modules de traitement linguistique ultérieurs tels que la traduction automatique. Dans cet article, les principes de base de l’évaluation ASR sont d’abord résumés, puis l’état de la recherche actuelle sur la détection et la correction des erreurs ASR est passé en revue. Nous nous concentrons sur les techniques émergentes utilisant la mesure du taux d’erreur sur les mots.

Plum Analytics

Artifact Widget

Comment citer

Errattahi, R., El Hannani, A., & Hassan. (2016). Détection et correction automatique des erreurs de reconnaissance vocale : un examen. AL-Lisaniyyat, 22(2), 40-43. https://doi.org/10.61850/allj.v22i2.372

Numéro

Vol. 22 No 2 (2016): v22i22016

Rubrique

Articles

Conformément à sa politique de publication en libre accès, la revue AL-Lisaniyyat reconnaît et garantit aux auteurs la titularité pleine et exclusive des droits d’auteur ainsi que des droits de propriété intellectuelle afférents à leurs contributions scientifiques.

La publication d’un article dans la revue n’entraîne aucun transfert, cession ou limitation de ces droits. Les auteurs conservent le droit de leurs travaux, sans qu’une autorisation préalable écrite de la revue ne soit requise.

Références

HTK Hidden Markov Model Toolkit , Speech recognition Toolkit avalaible at : hhtp://www.htk.eng.cam.ac.uk.
ITU-T Recommandation G.729, Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction CS-ACELP ,1996.
H.Yong, Z.Jiang ,Imlementation of ITU-T G729 Speech Code in IP Telephony Gateway ,Wuhan university Journal of natural sciences , vol.5, pp.159-163,2000.
B.Milner ,B, Semmani ,Robust speech Recognition Over Networks, IEEE International Conference Acoustics,Speech , And signal processing, pp.1791-1794, vol.3,2000.
Recommandation UIT-T G.711 , A high quality low-complexity algorithm for packet loss concealment with G.711, September 1999.
J.Wiley , Volp voice and fax signal processing , published simultaneously in Canada ,p.592,2008.
K.Nakamura, An Improvement ofG.711 PLC Using sinusoidal model proceedings of the IEEE The International conference on computer as a toll,pp.1670-1673,2005.
P.C.X. Sommen and J.A.K.S. Jayasinghe, On Frequency Domain Adaptive Filters using the Overlap-add Method , IEEE Philips Research Laboraories,pp.28-30,1988.

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Résumé

##plugins.themes.bootstrap3.article.details##

Références