إنشاء نظام (الجنة) لتركيب الكلام العربي من النص

##plugins.themes.bootstrap3.article.main##

نور الدين شنفور

الملخص

إن الدراسة التي نتقدم بها في هذه المقالة تدخل في إطار إنجاز نظام تحويل المكتوب إلى كلام منطوق.


سنقوم إذن بفحص المكونـات الأساسية لنظامـنا PARADIS الذي يعتمد على وصل "الديسلابـات" (di-syllabes) من جهة، وعلى تقنية TD-PSOLA من جهة أخرى. أما فيما يخص التحويل من الحروف إلى الكتابة الصوتية فهي تعتمد على مبدأ القواعد »المجمعـة« (règles compilées).


   بعد فحص المشـاكل المتعلقة بالكتابة الصوتية، نقوم بشرح الأسبـاب الرئيسية لاختيارنا لـ »الديسِلاب « كوحدة صوتية داخل النظام ومدى تحسينه لنوعية الكلام المنطوق الناتج عن عملية الإلصاق.


يعتمد نظامنا أساسا على تقنية TD-PSOLA التي تمكن من التفريق بين عملية التشفير وتقنية التأليف والعمل المباشر على الإشارة الصوتية وتقريب الكلام المولد من الطبيعي.

##plugins.themes.bootstrap3.article.details##

كيفية الاقتباس
شنفورن. ا. (2004). إنشاء نظام (الجنة) لتركيب الكلام العربي من النص. AL-Lisaniyyat, 9(2), 39-68. https://doi.org/10.61850/allj.v9i2.230
القسم
Articles

المراجع

Atal B.-S, Schroeder M. R., Predictive Coding Of Speech Signals, Proc. Conf. Commun. and Process., pp. 360-361,(1967).
Benabbou A., Etude et génération de la mélodie pour le système TD-PSOLA, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Benabbou A, Chenfour N., Mouradi A., Study and Quantification of the Declination for the Arabic Speech Synthesis in System PARADIS, LREC-2002, (2002).
Charpentier F. J., Stella, M. G., Diphone Synthesis Using an Overlap-Add Technique for Speech Waveforms Concatenation. Proc. Int. Conf. on Acoustics, Speech and Signal Processing, Tokyo, pp. 2015-2018, (1986).
Chenfour N., Réalisation d’un système de synthèse de la parole arabe à partir du texte par concaténation de di-syllabes, thèse pour l’obtention du titre de docteur de troisième cycle, Faculté des sciences Rabat, Université Mohammed V, (1997).
_________ , Réalisation d’un système de synthèse de la parole arabe à partir du texte (PARADIS) : Etude et génération des pauses et des durées syllabiques, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Chenfour N., Benabbou A, Mouradi A., Synthèse de la parole arabe TD-PSOLA, génération et codage automatiques du dictionnaire, ISIVC’2000, RABAT, pp. 112-122, (2000).
Chomsky N., Halle M., The Sound Pattern of English, Harper & Row, New York, (1968).
Dutoit T., High Quality Text-to-Speech of the French Language, Ph. D. dissertation, Faculté polytechnique de Mons, (1993).
Klatt D. H., Klatt L. C., « Analysis, Synthesis, and Perception of Voice Quality Variations among Female and Male Talkers », J. Acoust. Soc. Amer., vol. 87, n° 2., pp. 820-857, (1990).
Markel J. D. And A. H. Gray, Jr., Linear Prediction of Speech. Springer-Verlag, Berlin Heidelberg, New York, (1976).
Moulines E., Charpentier F. J., « Pitch Synchronous Waveform Processing Techniques for Text-to-Speech Synthesis Using Diphones », Speech Communication, vol. 9, n° 5-6, (1990).
Mouradi A., Synthèse de la parole arabe à partir du texte par la méthode des diphones, thèse de Doctorat, Fac. des Sciences, Rabat, Université Mohammed V, (1985).
Saito S., Itakura, F., The Theoritical Consideration of Statistically Optimum Methods for Speech Spectral Density, Report n°.3107, Electrical Communication Laboratory, N.T.T., Tokyo, (1966).
Taori R., Sluijter R.J. And Kathman E., Speech Compression Using Pitch Synchronous Interpolation, ICASSP 95 (pp. 512-515), (1995).
Xavier Marsault, Compression et cryptage en informatique, Edition Hermes, (1992).