اكتشاف شدة عسر التلفظ باستخدام الشبكات العصبية المتكررة والتلافيفية


أمينة حمزة
جمال عدو


يعتمد تشخيص ومراقبة اضطراب التلفظ، وهو اضطراب في الكلام ناجم عن مشاكل عصبية حركية تؤثر على النطق، على تقييم دقيق لدرجة اضطرابه القصوى. عند إنشاء أنظمة آلية لتحديد وتصنيف الكلام عند اضطراب التلفظ، فإن التصنيف الدقيق لدرجة الاضطراب أمر ضروري. باستخدام نماذج الشبكة العصبية، وتحديدًا الشبكات العصبية المتكررة (RNN) والشبكات العصبية التلافيفية (CNN)، تقدم هذه الورقة تحقيقًا شاملاً حول كيفية التمييز بين الأصوات ذات الاضطراب التلفظي بين مجموعة من عينات الاصوات الطبيعية وتصنيف شدة اضطراب التلفظ. من بين السمات المستخدمة في الدراسة، استعملنا جودة الصوت، والمؤشرات النغمية، والبواني الصوتية، ومؤشرات التردد الميلاني (MFCC)، والمنحنيات الطيفية. إن مقارنة قدرة الشبكات التلافيفية والشبكات المتكررة على تحديد الشذوذ في البيانات الطبيعية، بالإضافة إلى النموذج الهجين الذي يجمع بين الشبكات العصبية التلافيفية والشبكات المتكررة (CRNN)، يعتبر هدفنا من هذه الدراسة. قمنا باستغلال قاعدة البيانات Nemours لتقييم أداء نماذجنا للشبكات العصبية. في النهاية لاحظنا نسبة 99.8% التي تحصلنا عليها تعتبر أعلى دقة تصنيف تم تحقيقها باستخدام هذه القاعدة.


