论文摘要
环境噪声和竞争说话者的干扰是语音通信过程中常见的干扰情况。人的听觉系统可以在嘈杂的多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。然而,现有的语音处理系统无法做到这一点,其性能受到噪声和竞争说话者语音的严重影响。例如,当前的语音识别系统对纯净语音能够达到很高的识别率,但是当语音被噪声污染时,系统性能会急剧下降。语音信号增强和分离是抑制噪声干扰、还原原始语音信号的一种有效途径。近年来,基于麦克风阵列的语音增强技术在车载通信、多媒体会议以及机器人控制系统中得到广泛的应用。和单个麦克风相比,麦克风阵列在时频域的基础上增加了一个空间域,对来自空间不同方位的信号进行空时频联合处理。因此,麦克风阵列可以弥补单个孤立的麦克风在噪声处理、声源定位跟踪、语音提取分离等方面的不足,能够广泛应用于各种具有嘈杂背景的语音通信环境(如会场、多媒体教室、助听器、车载免提电话、战场等),以提高语音通信质量。麦克风阵列研究是阵列信号处理的新方向,具有广阔的市场应用前景。盲信号分离,是指在不知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出各个源信号的过程,它是实现语音分离的主流方法。独立分量分析(Independent Component Analysis,ICA),是在研究盲源分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获得了非常广泛的应用。到目前为止已经有诸多语音增强方法被提出,但是强噪环境下的语音增强仍是一个具有挑战性的课题;另外,卷积盲分离的研究对于语音分离的实际应用具有重大意义,频域盲分离是解卷积的行之有效的方法,然而顺序不确定性成为一个严重的问题。本论文重点对以上两个问题进行研究和探索。本论文对ICA的基本理论、麦克风阵列语音增强技术和卷积混叠语音信号的盲分离进行了详细介绍;对麦克风阵列信号处理技术在语音信号处理中的应用进行了分析和探讨,并针对当前语音增强和分离的研究现状,对强噪环境下基于麦克风阵列的语音增强和频域内盲反卷积的顺序不确定性问题进行了研究和探索。主要进行了以下解决方案的研究:1.提出了基于ICA的麦克风阵列语音增强方法。方案中,我们首先利用ICA对严重污染的语音信号进行分析,提取出相对纯净的目标信号;然后通过后续的麦克风阵列语音增强系统(如维纳后滤波,GSC等),得到最后的增强信号。真实环境下的实验证明了该方法的有效性。2.提出了一种利用麦克风嵌套子阵列纠正频域反卷积的顺序模糊问题的方法。频域盲分离的顺序不确定性是一个严重的问题,如果顺序模糊不能得到正确的纠正,将导致算法性能下降,甚至解卷积失败。这里提出一种利用麦克风嵌套子阵列,结合DOA法和相关法纠正顺序模糊的方案。该方法能够得到更多的高可信度的DOA估计,在低频尤其如此;然后利用相关法对其余的频率点进行顺序调整。实验证明提出的方案具有较高的稳健性。应该指出的是,语音增强和卷积信号的频域盲分离研究中仍然存在着许多尚未解决的问题。论文最后对本课题的研究进行了总结和展望。
论文目录
相关论文文献
标签:语音增强论文; 语音分离论文; 麦克风阵列论文; 独立分量分析论文; 卷积混叠论文; 频域盲反卷积论文; 顺序不确定性论文;