REALISATION D’UN SYSTEME (PARADIS) POUR LA SYNTHESE DE LA PAROLE ARABE A PARTIR DU TEXTE
##plugins.themes.bootstrap3.article.main##
Résumé
L’étude que nous présentons dans cet article s’inscrit dans le cadre de la réalisation d’un système de synthèse de la parole à partir du texte pour la langue arabe.
Nous examinerons l’architecture générale de notre système PARADIS basé sur la concaténation des di-syllabes avec TD-PSOLA comme technique de synthèse, et la transcription graphème - phonème suivant le principe des règles compilées.
Après avoir examiné les problèmes de transcription phonétique, nous présentons l’intérêt du choix de la di-syllabe comme unité de concaténation pour le synthétiseur et son apport au niveau de la qualité de synthèse. En effet, la di-syllabe permet de réduire les problèmes de discontinuité temporelle lors de la concaténation. L’une des composantes fondamentales de notre système de syn-thèse de la parole arabe PARADIS est le synthétiseur TD-PSOLA. Il est connu par sa capacité d’action directe sur le signal de parole et par le concept de séparation entre l’algorithme de codage et la tech-nique de synthèse. Il garantit ainsi une grande flexibilité au niveau suprasegmental et offre de très bonnes possibilités de variations prosodiques, ce qui apporte plus de naturel à la parole synthétique.
Mots Clés
##plugins.themes.bootstrap3.article.details##
Références
Benabbou A., Etude et génération de la mélodie pour le système TD-PSOLA, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Benabbou A, Chenfour N., Mouradi A., Study and Quantification of the Declination for the Arabic Speech Synthesis in System PARADIS, LREC-2002, (2002).
Charpentier F. J., Stella, M. G., Diphone Synthesis Using an Overlap-Add Technique for Speech Waveforms Concatenation. Proc. Int. Conf. on Acoustics, Speech and Signal Processing, Tokyo, pp. 2015-2018, (1986).
Chenfour N., Réalisation d’un système de synthèse de la parole arabe à partir du texte par concaténation de di-syllabes, thèse pour l’obtention du titre de docteur de troisième cycle, Faculté des sciences Rabat, Université Mohammed V, (1997).
_________ , Réalisation d’un système de synthèse de la parole arabe à partir du texte (PARADIS) : Etude et génération des pauses et des durées syllabiques, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Chenfour N., Benabbou A, Mouradi A., Synthèse de la parole arabe TD-PSOLA, génération et codage automatiques du dictionnaire, ISIVC’2000, RABAT, pp. 112-122, (2000).
Chomsky N., Halle M., The Sound Pattern of English, Harper & Row, New York, (1968).
Dutoit T., High Quality Text-to-Speech of the French Language, Ph. D. dissertation, Faculté polytechnique de Mons, (1993).
Klatt D. H., Klatt L. C., « Analysis, Synthesis, and Perception of Voice Quality Variations among Female and Male Talkers », J. Acoust. Soc. Amer., vol. 87, n° 2., pp. 820-857, (1990).
Markel J. D. And A. H. Gray, Jr., Linear Prediction of Speech. Springer-Verlag, Berlin Heidelberg, New York, (1976).
Moulines E., Charpentier F. J., « Pitch Synchronous Waveform Processing Techniques for Text-to-Speech Synthesis Using Diphones », Speech Communication, vol. 9, n° 5-6, (1990).
Mouradi A., Synthèse de la parole arabe à partir du texte par la méthode des diphones, thèse de Doctorat, Fac. des Sciences, Rabat, Université Mohammed V, (1985).
Saito S., Itakura, F., The Theoritical Consideration of Statistically Optimum Methods for Speech Spectral Density, Report n°.3107, Electrical Communication Laboratory, N.T.T., Tokyo, (1966).
Taori R., Sluijter R.J. And Kathman E., Speech Compression Using Pitch Synchronous Interpolation, ICASSP 95 (pp. 512-515), (1995).
Xavier Marsault, Compression et cryptage en informatique, Edition Hermes, (1992).