Techniques d'amélioration du signal vocal


Chouki Zegar
Abdelhakim Dahimene


L'amélioration de la parole et la réduction du bruit ont de nombreuses applications dans le traitement de la parole. Ils sont souvent utilisés comme étape de prétraitement dans diverses applications. Le travail présenté dans cet article consiste à débruiter un signal vocal monocanal en présence d'un bruit de fond hautement non stationnaire afin d'améliorer la qualité perceptible et l'intelligibilité de la parole. Le bruit du monde réel est pour la plupart très non stationnaire et n’affecte pas le signal vocal de manière uniforme sur tout le spectre. Cet article explore un ensemble d'algorithmes basés sur la DFT en tant que techniques d'amélioration de la parole monocanal qui sont les suivantes :  Soustraction spectrale utilisant la sursoustraction et le plancher spectral.  Soustraction spectrale multibande (MBSS).  Filtre Wiener.  Estimateur MMSE de l'amplitude spectrale à court terme (MMSE-STSA) avec et sans utilisation du modificateur SPU.  Estimateur d'amplitude log-spectrale MMSE avec et sans utilisation du modificateur SPU. Estimateur d'amplitude log-spectrale modifié de manière optimale (OM-LSA). Les résultats de l'étude comparative basés sur des tests subjectifs et objectifs ont montré que la méthode OM-LSA (Optimally Modified Log-Spectral Amplitude Estimator) surpasse tous les algorithmes d'amélioration de la parole monocanal basés sur DFT mis en œuvre.


Comment citer
Zegar, C., & Dahimene, A. (2014). Techniques d’amélioration du signal vocal. AL-Lisaniyyat, 20(1), 63-76.


