REALISATION D’UN SYSTEME (PARADIS) POUR LA SYNTHESE DE LA PAROLE ARABE A PARTIR DU TEXTE

نور الدين شنفور

doi:10.61850/allj.v9i2.230

pdf (Français (Canada))

منشور: Dec 25, 2004

DOI: https://doi.org/10.61850/allj.v9i2.230

الكلمات المفتاحية:

علاج الكلام المنطوق – الديسلاب - تقنية TD-PSOLA – إشارات قصيرة المدى - علامات النغمة – الكتابة الصوتية.

نور الدين شنفور

جامعة محمد بن عبد الله، كلية العلوم ظهر المحرز فاس، قسم الرياضيات وعلوم الحاسوب.

الملخص

إن الدراسة التي نتقدم بها في هذه المقالة تدخل في إطار إنجاز نظام تحويل المكتوب إلى كلام منطوق.

سنقوم إذن بفحص المكونـات الأساسية لنظامـنا PARADIS الذي يعتمد على وصل "الديسلابـات" (di-syllabes) من جهة، وعلى تقنية TD-PSOLA من جهة أخرى. أما فيما يخص التحويل من الحروف إلى الكتابة الصوتية فهي تعتمد على مبدأ القواعد »المجمعـة« (règles compilées).

بعد فحص المشـاكل المتعلقة بالكتابة الصوتية، نقوم بشرح الأسبـاب الرئيسية لاختيارنا لـ »الديسِلاب « كوحدة صوتية داخل النظام ومدى تحسينه لنوعية الكلام المنطوق الناتج عن عملية الإلصاق.

يعتمد نظامنا أساسا على تقنية TD-PSOLA التي تمكن من التفريق بين عملية التشفير وتقنية التأليف والعمل المباشر على الإشارة الصوتية وتقريب الكلام المولد من الطبيعي.

Plum Analytics

Artifact Widget

كيفية الاقتباس

شنفورن. ا. (2004). إنشاء نظام (الجنة) لتركيب الكلام العربي من النص. AL-Lisaniyyat, 9(2), 39-68. https://doi.org/10.61850/allj.v9i2.230

إصدار

مجلد 9 عدد 2 (2004): v9i22004

القسم

Articles

وفقًا لسياسة النشر المعتمدة في الوصول الحر، تقرّ مجلة السانيات وتضمن احتفاظ المؤلفين بالملكية الكاملة والحصرية لحقوق التأليف وحقوق الملكية الفكرية المتعلقة بإسهاماتهم العلميةولا يترتب على نشر المقال في المجلة أي نقل أو تنازل أو تقييد لهذه الحقوق. ويظل للمؤلفين الحق الكامل في أعمالهم دون الحاجة إلى الحصول على إذن كتابي مسبق من المجلة

المراجع

Atal B.-S, Schroeder M. R., Predictive Coding Of Speech Signals, Proc. Conf. Commun. and Process., pp. 360-361,(1967).
Benabbou A., Etude et génération de la mélodie pour le système TD-PSOLA, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Benabbou A, Chenfour N., Mouradi A., Study and Quantification of the Declination for the Arabic Speech Synthesis in System PARADIS, LREC-2002, (2002).
Charpentier F. J., Stella, M. G., Diphone Synthesis Using an Overlap-Add Technique for Speech Waveforms Concatenation. Proc. Int. Conf. on Acoustics, Speech and Signal Processing, Tokyo, pp. 2015-2018, (1986).
Chenfour N., Réalisation d’un système de synthèse de la parole arabe à partir du texte par concaténation de di-syllabes, thèse pour l’obtention du titre de docteur de troisième cycle, Faculté des sciences Rabat, Université Mohammed V, (1997).
_________ , Réalisation d’un système de synthèse de la parole arabe à partir du texte (PARADIS) : Etude et génération des pauses et des durées syllabiques, thèse pour l’obtention du titre de docteur en informatique, ENSIAS Rabat, Université Mohammed V, (2001).
Chenfour N., Benabbou A, Mouradi A., Synthèse de la parole arabe TD-PSOLA, génération et codage automatiques du dictionnaire, ISIVC’2000, RABAT, pp. 112-122, (2000).
Chomsky N., Halle M., The Sound Pattern of English, Harper & Row, New York, (1968).
Dutoit T., High Quality Text-to-Speech of the French Language, Ph. D. dissertation, Faculté polytechnique de Mons, (1993).
Klatt D. H., Klatt L. C., « Analysis, Synthesis, and Perception of Voice Quality Variations among Female and Male Talkers », J. Acoust. Soc. Amer., vol. 87, n° 2., pp. 820-857, (1990).
Markel J. D. And A. H. Gray, Jr., Linear Prediction of Speech. Springer-Verlag, Berlin Heidelberg, New York, (1976).
Moulines E., Charpentier F. J., « Pitch Synchronous Waveform Processing Techniques for Text-to-Speech Synthesis Using Diphones », Speech Communication, vol. 9, n° 5-6, (1990).
Mouradi A., Synthèse de la parole arabe à partir du texte par la méthode des diphones, thèse de Doctorat, Fac. des Sciences, Rabat, Université Mohammed V, (1985).
Saito S., Itakura, F., The Theoritical Consideration of Statistically Optimum Methods for Speech Spectral Density, Report n°.3107, Electrical Communication Laboratory, N.T.T., Tokyo, (1966).
Taori R., Sluijter R.J. And Kathman E., Speech Compression Using Pitch Synchronous Interpolation, ICASSP 95 (pp. 512-515), (1995).
Xavier Marsault, Compression et cryptage en informatique, Edition Hermes, (1992).

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

الملخص

##plugins.themes.bootstrap3.article.details##

المراجع