تقنيات تعزيز إشارة الكلام
##plugins.themes.bootstrap3.article.main##
الملخص
تحسين الكلام وتقليل الضوضاء لهما تطبيقات واسعة في معالجة الكلام. غالبًا ما يتم استخدامها كمرحلة معالجة مسبقة في تطبيقات مختلفة. العمل الذي سيتم تقديمه في هذه الورقة هو تقليل الضوضاء لإشارة الكلام أحادية القناة في وجود ضوضاء خلفية غير ثابتة للغاية من أجل تحسين الجودة الملموسة ووضوح الكلام. ضوضاء العالم الحقيقي في الغالب غير ثابتة إلى حد كبير ولا تؤثر على إشارة الكلام بشكل موحد عبر الطيف. يستكشف هذا البحث مجموعة من الخوارزميات المعتمدة على DFT كتقنيات تحسين الكلام أحادية القناة وهي كما يلي: الطرح الطيفي باستخدام الطرح الزائد والأرضية الطيفية. الطرح الطيفي متعدد النطاقات (MBSS). مرشح وينر. مقدر السعة الطيفية قصيرة المدى (MMSE-STSA) مع وبدون استخدام معدل SPU. مقدر السعة اللوغاريتمية الطيفية MMSE مع وبدون استخدام معدّل SPU. مُقدِّر السعة اللوغاريتمية الطيفية المعدل على النحو الأمثل (OM-LSA). أظهرت نتائج دراسة المقارنة المستندة إلى الاختبارات الذاتية والموضوعية أن طريقة مقدِّر السعة اللوغاريتمية الطيفية المعدلة على النحو الأمثل (OM-LSA) تتفوق في الأداء على جميع خوارزميات تحسين الكلام أحادية القناة القائمة على DFT
##plugins.themes.bootstrap3.article.details##
المراجع
noise estimation. Proc. IEEE Int. Conf.
Acoust. Speech Signal Processing, 629-
632. [6] Ephraim Y. and Malah D, “Speech enhancement using a minimum mean- square error short-time spectral amplitude
estimator,” IEEE Trans. Acoustics, Speech, Signal Processing, vol. ASSP-32,
pp. 1109-1121, Dec. 1984.
[7] Boll, S.F., “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. on Acoust., Speech, Signal Proc., Vol. ASSP-27, No.2, pp.113-12 April 1979. [8] Middleton D. and Esposito R, “Simulta- neous optimum detection and estimation of signals in noise.” IEEE Trans. Inform. Theory, vol. IT-14, pp. 434444, May 1968 H. L. [9] Cohen L “Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator,” La- mar Signal Processing Ltd.2003. [10] Soon L Y., Koh S. N. and Yeo C. K. “Improved Noise Suppression Filter Us ing Self Adaptive Estimator of Probab ity of Speech Absence,” Signal Pro- cessing, vol. 75, pp. 151-159, 1999. [11] Martin R, Wittke Land Jax P., “Optmi- zed Estimation of Spectral Parameters for the Coding of Noisy Speech,"in Proc. Int. Conf. Acoustics, Speech and Signal Pro- cessing, ICASSP 2000, pp. 1479-1482. [12] Cohen L and Berdugo B., “Speech En- hancement for Non-Stationary Noise En- vironments,” to appear in Signal Pro- cessing. [13] Cohen L and Berdugo B., “Speech En- hancement for Non-Stationary Noise En- vironments,” to appear in Signal Pro- cessing. [14] Hu Y. and Loizou P. “Subjective evalua- tion and comparison of speech enhance- ment algorithms,” Speech Communica- tion, 49, 588-601. [15] Sovka, P, “Extended Spectral Substraction:Description and Preliminary Results” [Research Report]. R95-2. Pra- gue, CTU, Faculty of Electrical Engineer- ing 1995. pp 15.