تقنيات تعزيز إشارة الكلام


شوقي زقار
عبد الحكيم دحيمن


تحسين الكلام وتقليل الضوضاء لهما تطبيقات واسعة في معالجة الكلام. غالبًا ما يتم استخدامها كمرحلة معالجة مسبقة في تطبيقات مختلفة. العمل الذي سيتم تقديمه في هذه الورقة هو تقليل الضوضاء لإشارة الكلام أحادية القناة في وجود ضوضاء خلفية غير ثابتة للغاية من أجل تحسين الجودة الملموسة ووضوح الكلام. ضوضاء العالم الحقيقي في الغالب غير ثابتة إلى حد كبير ولا تؤثر على إشارة الكلام بشكل موحد عبر الطيف. يستكشف هذا البحث مجموعة من الخوارزميات المعتمدة على DFT كتقنيات تحسين الكلام أحادية القناة وهي كما يلي:  الطرح الطيفي باستخدام الطرح الزائد والأرضية الطيفية.  الطرح الطيفي متعدد النطاقات (MBSS).  مرشح وينر.  مقدر السعة الطيفية قصيرة المدى (MMSE-STSA) مع وبدون استخدام معدل SPU.  مقدر السعة اللوغاريتمية الطيفية MMSE مع وبدون استخدام معدّل SPU. مُقدِّر السعة اللوغاريتمية الطيفية المعدل على النحو الأمثل (OM-LSA). أظهرت نتائج دراسة المقارنة المستندة إلى الاختبارات الذاتية والموضوعية أن طريقة مقدِّر السعة اللوغاريتمية الطيفية المعدلة على النحو الأمثل (OM-LSA) تتفوق في الأداء على جميع خوارزميات تحسين الكلام أحادية القناة القائمة على DFT


كيفية الاقتباس
زقارش., & دحيمنع. ا. (2014). تقنيات تعزيز إشارة الكلام. AL-Lisaniyyat, 20(1), 63-76. https://doi.org/10.61850/allj.v20i1.505


