论文摘要
传声器阵列可作为声通信系统的一个组成部分,用于拾取声信号。传声器阵列可用在语音增强、波束形成、系统辨识、去混响、语音识别与话者识别、声源定位与跟踪、回声抵消和语音分离等领域。本文基于传声器阵列研究混响和噪声环境中的多通道盲辨识、声源定位与跟踪。为提高多通道盲辨识对非高斯噪声的鲁棒性,提出了一种归一化多通道频域自适应最小平均M-估计算法。不同于使用平方误差作为代价函数的传统方法,所提算法使用M-估计器构建多通道频域自适应滤波的代价函数,利用M估计器对非高斯噪声的不敏感性提高算法的性能。真实声环境的实验数据验证了提出的算法的优越性。从非互信息角度提出了一种鲁棒的时延估计算法。将多个随机变量的联合熵分解成多个随机变量间的互信息和非互信息两类信息,提取出多个传声器信号间的非互信息构造时延估计器,获得对房间混响具有鲁棒性的算法。将多通道互相关系数算法从仅使用空间信息推广到使用空时信息,提出了一种基于多通道空时预测的时延估计算法。理论分析表明所提算法对传声器信号起预白化作用,并对混响具有鲁棒性。进一步提出递归算法来降低所提算法的运算复杂度。仿真实验证实了提出的算法的优越性以及递归算法的有效性。利用超心型指向性传声器建立了一种正方形阵列,对阵列的频响特性和指向性进行了分析,使其具有360度全方位拾音功能。在该阵列结构的基础上,提出了一种最大能量发言人自动跟踪算法,并通过实验验证了阵列和算法的有效性。
论文目录
摘要Abstract目录第一章 绪论1.1 传声器阵列概论1.2 传声器阵列声通道盲辨识技术1.3 传声器阵列声源定位与跟踪技术1.4 选题背景与意义1.5 本文的主要工作第二章 非高斯噪声环境中的多通道盲辨识2.1 引言2.2 对称α稳定分布噪声模型2.3 鲁棒的多通道盲辨识算法2.3.1 算法推导2.3.2 M估计器的选择2.4 仿真2.4.1 环境2.4.2 性能标准2.4.3 结果与讨论2.5 本章小结第三章 基于多个传声器间的非互信息的时延估计3.1 引言3.2 非互信息3.3 基于非互信息的时延估计3.3.1 信号模型3.3.2 基于非互信息的时延估计准则3.3.3 基于非互信息的时延估计3.4 仿真3.4.1 环境3.4.2 性能标准3.4.3 结果3.5 本章小结第四章 基于多通道空时预测的时延估计4.1 引言4.2 基于多通道空时预测的时延估计4.2.1 信号模型4.2.2 基于空间和时间前向预测的时延估计4.2.3 多通道空时预测算法的性能分析4.2.4 基于空间和时间后向预测的时延估计4.2.5 基于递归空时预测的时延估计4.2.6 计算复杂度比较4.3 仿真4.3.1 环境4.3.2 性能标准4.3.3 结果与讨论4.4 本章小结第五章 基于指向性传声器阵列的声源跟踪5.1 引言5.2 指向性传声器阵列360度全向拾音分析5.2.1 超心型指向性传声器的频率响应与指向性5.2.2 指向性传声器构成的阵列结构与性能分析5.2.3 实验分析5.3 指向性传声器阵列自动跟踪能量最大发言人算法5.3.1 算法准则5.3.2 基于能量切换的自动跟踪能量最大发言人算法5.3.3 参数确定5.3.4 算法验证5.4 本章小结第六章 总结与展望6.1 全文总结6.2 未来工作参考文献致谢作者在研究生攻读期间的成果
相关论文文献
标签:传声器阵列论文; 多通道盲辨识论文; 非高斯噪声论文; 估计器论文; 声源定位论文;