论文摘要
语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一。然而由于受到各种噪声的影响,使接收者接收到的语音已非纯净的原始语音信号,而是受到噪声污染的带噪语音信号。在这种情况下,必须通过语音增强系统对带噪语音信号进行处理,尽可能恢复出原始纯净语音信号,从而提高语音质量。本文进行了以下几个方面的研究工作:研究了时延估计方法。在一些麦克风阵列语音增强系统中,时延估计是其中的一个重要环节,然而传统时延估计方法有的适用于相干噪声场,有的适用于非相干噪声场,并且在低信噪比及混响情况下,时延估计性能下降。针对这些问题,给出了两种改进的时延估计方法。一种为基于最大后验估计理论的时延估计方法,该方法可以改进传统方法在低信噪比情况下和相关及不相关噪声环境下的时延估计性能。另一种为小波域自适应特征值分解时延估计方法,该方法在各种混响环境和信噪比情况下均具有较好的时延估计能力。计算机仿真实验结果表明了两种改进方法的有效性和可靠性。针对观测信号数目小于源信号数目情况下,盲源分离方法性能下降的问题,给出了一种改进方法。该方法利用小波变换可以消除噪声的特性,将小波变换和盲源分离方法相结合,通过对小波变换的小波系数进行盲源分离,从而抑制了一部分噪声。计算机仿真实验结果表明,该方法相对于原方法而言信噪比改善明显;听音测试表明,该方法对语音的损伤较小,增强效果比较理想。研究了一种近似完全重构的滤波器组设计方法和基于子带盲源分离和后置处理的语音增强方法。由于盲源分离算法分离质量的高低对自适应噪声抵消的噪声抑制效果影响较大,并且对盲源分离质量的高低进行客观评价有一定难度,针对这一问题,给出了一种改进方法,即用谱相减技术代替自适应噪声抵消器作为后置处理模块,进一步去除残留噪声。计算机仿真实验结果表明,该方法对语音信号的损伤小,使语音的可听性增强,同时对噪声抑制效果更加明显。