Techniques d'amélioration du signal vocal
##plugins.themes.bootstrap3.article.main##
Résumé
L'amélioration de la parole et la réduction du bruit ont de nombreuses applications dans le traitement de la parole. Ils sont souvent utilisés comme étape de prétraitement dans diverses applications. Le travail présenté dans cet article consiste à débruiter un signal vocal monocanal en présence d'un bruit de fond hautement non stationnaire afin d'améliorer la qualité perceptible et l'intelligibilité de la parole. Le bruit du monde réel est pour la plupart très non stationnaire et n’affecte pas le signal vocal de manière uniforme sur tout le spectre. Cet article explore un ensemble d'algorithmes basés sur la DFT en tant que techniques d'amélioration de la parole monocanal qui sont les suivantes : Soustraction spectrale utilisant la sursoustraction et le plancher spectral. Soustraction spectrale multibande (MBSS). Filtre Wiener. Estimateur MMSE de l'amplitude spectrale à court terme (MMSE-STSA) avec et sans utilisation du modificateur SPU. Estimateur d'amplitude log-spectrale MMSE avec et sans utilisation du modificateur SPU. Estimateur d'amplitude log-spectrale modifié de manière optimale (OM-LSA). Les résultats de l'étude comparative basés sur des tests subjectifs et objectifs ont montré que la méthode OM-LSA (Optimally Modified Log-Spectral Amplitude Estimator) surpasse tous les algorithmes d'amélioration de la parole monocanal basés sur DFT mis en œuvre.
##plugins.themes.bootstrap3.article.details##
Références
noise estimation. Proc. IEEE Int. Conf.
Acoust. Speech Signal Processing, 629-
632. [6] Ephraim Y. and Malah D, “Speech enhancement using a minimum mean- square error short-time spectral amplitude
estimator,” IEEE Trans. Acoustics, Speech, Signal Processing, vol. ASSP-32,
pp. 1109-1121, Dec. 1984.
[7] Boll, S.F., “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. on Acoust., Speech, Signal Proc., Vol. ASSP-27, No.2, pp.113-12 April 1979. [8] Middleton D. and Esposito R, “Simulta- neous optimum detection and estimation of signals in noise.” IEEE Trans. Inform. Theory, vol. IT-14, pp. 434444, May 1968 H. L. [9] Cohen L “Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator,” La- mar Signal Processing Ltd.2003. [10] Soon L Y., Koh S. N. and Yeo C. K. “Improved Noise Suppression Filter Us ing Self Adaptive Estimator of Probab ity of Speech Absence,” Signal Pro- cessing, vol. 75, pp. 151-159, 1999. [11] Martin R, Wittke Land Jax P., “Optmi- zed Estimation of Spectral Parameters for the Coding of Noisy Speech,"in Proc. Int. Conf. Acoustics, Speech and Signal Pro- cessing, ICASSP 2000, pp. 1479-1482. [12] Cohen L and Berdugo B., “Speech En- hancement for Non-Stationary Noise En- vironments,” to appear in Signal Pro- cessing. [13] Cohen L and Berdugo B., “Speech En- hancement for Non-Stationary Noise En- vironments,” to appear in Signal Pro- cessing. [14] Hu Y. and Loizou P. “Subjective evalua- tion and comparison of speech enhance- ment algorithms,” Speech Communica- tion, 49, 588-601. [15] Sovka, P, “Extended Spectral Substraction:Description and Preliminary Results” [Research Report]. R95-2. Pra- gue, CTU, Faculty of Electrical Engineer- ing 1995. pp 15.