ANALYSE ACOUSTIQUE MULTIVARIABLE APPLIQUÉE À LA RECONNAISSANCE DES CONSONNES EMPHATIQUES DE L’ARABE STANDARD

Mahraz Kabache; Mhania GUERTI

doi:10.61850/allj.v18i2.473

pdf

Publié-e : déc 25, 2012

DOI : https://doi.org/10.61850/allj.v18i2.473

Mots-clés :

Reconnaissance Automatique de la Parole - Réseaux de Neurones Artificiels - consonnes emphatiques de l’arabe standard - techniques d’analyse de la parole.

Mahraz Kabache

Centre de recherche scientifique et technique pour le développement de la langue Arabe CRSTDLA

Mhania GUERTI

Ecole Nationale Polytechnique

Résumé

Le but de ce travail est la reconnaissance des Consonnes
Emphatiques (CE) de l’Arabe Standard (AS) en appliquant une
analyse acoustique multivariable afin d’enrichir les techniques
d’analyse usuelles en incluant deux autres paramètres (l’énergie et
le Taux de Passage par Zéro : TPZ). Nous avons analysé le corpus
d’apprentissage et le comus de test par les techniques PLP (Perceptual Linear Prediction), RASTA-PLP (RelAtive SpecTrAlPerceptual Linear Prediction), LPC (Lincar Predictive Coding), l’énergie et le TPZ. Pour atteindre cet objectif, nous avons utilisé
les Réseaux de Neurones Multicouches (Multi Layer Perceptrons : MLP) comme technique de reconnaissance de formes. Les phonèmes à reconnaître sont pris dans un corpus constitué de 84 phrases porteuses en AS, enregistrées par un seul locuteur, afin de prendre en considération le phénomène de la coarticulation
(influence contextuelle d’un son sur un son contigu). L’analyse
des résultats obtenus est encourageante car elle fournit un Taux de Reconnaissance (TR) de 71.29 % où les phonèmes à reconnaitre
sont pris dans des contextes différents (l’effet de la coarticulation a été cerné). Il faut mentionner que le développement d’un système à base de réseaux neuronaux est une tâche délicate qui nécessite
beaucoup d’expériences. En effet, de nombreuses difficultés
existent concernant le choix et le dimensionnement du réseau, les
paramètres à ajuster, le contrôle du système, etc.

Plum Analytics

Artifact Widget

Comment citer

Kabache, M., & GUERTI, M. (2012). ANALYSE ACOUSTIQUE MULTIVARIABLE APPLIQUÉE À LA RECONNAISSANCE DES CONSONNES EMPHATIQUES DE L’ARABE STANDARD . AL-Lisaniyyat, 18(2), 83-99. https://doi.org/10.61850/allj.v18i2.473

Numéro

Vol. 18 No 2 (2012): v18i22012

Rubrique

Articles

Références

1
2]
131
[4]
151
16]
171
18]
191
Calliope, 1989. La parole et son traitement automatique, Collection technique et
scientifique des télécommunications, CNET/ ENST, Ed. Masson.
Kabache, M. et M. Guerti, 2005. Application des réseaux de neurones à la
reconnaissance des phonèmes spécifiques à l’arabe standard, Conférence
internationale de TEEE : Sciences Electroniques, Technologies de l’Information et
des Télécommunications, SETIT’2005, Sousse, Tunisie, p. 218, 27-31 Mars 2005.
Benzaoui, M.L. et M. Guerti, 1999. Durées intrinsèques des sons spécifiques à
l’arabe standard, AJOT, série B, vol.14, N°1, pp. 114-125.
Selouani, S.A., 2000. Reconnaissance automatique de la parole par des techniques
multi-agents, connexionnistes et hybrides : application à la langue arabe, Thèse de
doctorat d’état USTHB, Alger, Algérie.
Betari, A., 1993. Caractérisation des phonèmes de l’arabe standard en vue d’une
reconnaissance automatique de la parole, Thèse de doctorat, Aix-En-Provence,
France.
Haton, J.P., 1995. Modèles neuronaux et hybrides en reconnaissance de la parole :
état de recherches, fondement et perspectives en traitement automatique de la
parole, Edition H. Meloni.
Jodouin, J.F., 1994. Les réseaux de neurones : principe et définition, Edition
Hermès.
Hérault J. et C. Jutten, 1994. Réseaux neuronaux et traitement de signal,
Edition Hermés.
Botou, L., 1991. Une approche théorique de l’apprentissage connexionniste :
application à la reconnaissance de la parole, Thèse de doctorat, Paris sud, France.
[10]Botou, L., 1988. Reconnaissance de la parole par réseaux multi-couches,
Proceedings of the International Workshop on Neural Networks and Their
Applications, pp. 197-217.
[11] Harmensky, H., 1990. Perceptual Linear Predictive Analyses of Speech, J.
Acoust. Soc. Am. Vol. 87.
[12] Harmensky, H., 1997. Should Recognizer Have Ears ? Robust Speech Recognition
for Unknown Communication Channels. Pont-à- Mousson, France.
[13]Yousfi, A. et A. Meziane, 2002. Introduction de l’énergie dans un modèle de
reconnaissance automatique de la parole, XXIV*"° Journées d’études sur la parole,
Nancy, France, pp, 317-320, 24-27 juin 2002.
[14] Aissiou, M. et M. Guerti, 2009. Genetic Supervised Classification of Standard
Arabic Fricative Sounds, Int. J. Speech Technology, Vol.12. Issue 4, pp : 139- 147. Print ISSN : 1381-2416 Online ISSN : 1572-8110, décembre 2009.
DOI : 10 1007/10772-009-9061-5
http://www.citeulike.org/journal/springerlink-100275

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Résumé

##plugins.themes.bootstrap3.article.details##

Références

Articles les plus lus du même(s) auteurs(s)