基于传声器阵列的建模和定位算法研究

论文摘要

传声器阵列可作为声通信系统的一个组成部分,用于拾取声信号。传声器阵列可用在语音增强、波束形成、系统辨识、去混响、语音识别与话者识别、声源定位与跟踪、回声抵消和语音分离等领域。本文基于传声器阵列研究混响和噪声环境中的多通道盲辨识、声源定位与跟踪。为提高多通道盲辨识对非高斯噪声的鲁棒性,提出了一种归一化多通道频域自适应最小平均M-估计算法。不同于使用平方误差作为代价函数的传统方法,所提算法使用M-估计器构建多通道频域自适应滤波的代价函数,利用M估计器对非高斯噪声的不敏感性提高算法的性能。真实声环境的实验数据验证了提出的算法的优越性。从非互信息角度提出了一种鲁棒的时延估计算法。将多个随机变量的联合熵分解成多个随机变量间的互信息和非互信息两类信息,提取出多个传声器信号间的非互信息构造时延估计器,获得对房间混响具有鲁棒性的算法。将多通道互相关系数算法从仅使用空间信息推广到使用空时信息,提出了一种基于多通道空时预测的时延估计算法。理论分析表明所提算法对传声器信号起预白化作用,并对混响具有鲁棒性。进一步提出递归算法来降低所提算法的运算复杂度。仿真实验证实了提出的算法的优越性以及递归算法的有效性。利用超心型指向性传声器建立了一种正方形阵列,对阵列的频响特性和指向性进行了分析,使其具有360度全方位拾音功能。在该阵列结构的基础上,提出了一种最大能量发言人自动跟踪算法,并通过实验验证了阵列和算法的有效性。

论文目录

摘要

Abstract

第一章绪论

1.1 传声器阵列概论

1.2 传声器阵列声通道盲辨识技术

1.3 传声器阵列声源定位与跟踪技术

1.4 选题背景与意义

1.5 本文的主要工作

第二章非高斯噪声环境中的多通道盲辨识

2.1 引言

2.2 对称α稳定分布噪声模型

2.3 鲁棒的多通道盲辨识算法

2.3.1 算法推导

2.3.2 M估计器的选择

2.4 仿真

2.4.1 环境

2.4.2 性能标准

2.4.3 结果与讨论

2.5 本章小结

第三章基于多个传声器间的非互信息的时延估计

3.1 引言

3.2 非互信息

3.3 基于非互信息的时延估计

3.3.1 信号模型

3.3.2 基于非互信息的时延估计准则

3.3.3 基于非互信息的时延估计

3.4 仿真

3.4.1 环境

3.4.2 性能标准

3.4.3 结果

3.5 本章小结

第四章基于多通道空时预测的时延估计

4.1 引言

4.2 基于多通道空时预测的时延估计

4.2.1 信号模型

4.2.2 基于空间和时间前向预测的时延估计

4.2.3 多通道空时预测算法的性能分析

4.2.4 基于空间和时间后向预测的时延估计

4.2.5 基于递归空时预测的时延估计

4.2.6 计算复杂度比较

4.3 仿真

4.3.1 环境

4.3.2 性能标准

4.3.3 结果与讨论

4.4 本章小结

第五章基于指向性传声器阵列的声源跟踪

5.1 引言

5.2 指向性传声器阵列360度全向拾音分析

5.2.1 超心型指向性传声器的频率响应与指向性

5.2.2 指向性传声器构成的阵列结构与性能分析

5.2.3 实验分析

5.3 指向性传声器阵列自动跟踪能量最大发言人算法

5.3.1 算法准则

5.3.2 基于能量切换的自动跟踪能量最大发言人算法

5.3.3 参数确定

5.3.4 算法验证

5.4 本章小结

第六章总结与展望

6.1 全文总结

6.2 未来工作

参考文献

致谢

作者在研究生攻读期间的成果

基于传声器阵列的建模和定位算法研究

论文摘要

论文目录

相关论文文献

猜你喜欢