论文摘要
环境声音中包含着丰富的信息,可为自然保护提供有效的数据支持,应用于机器人导航,家庭自动化,移动终端设备等。研究真实情境下环境声音事件的识别方法有更直接的理论意义和实用价值,然而识别系统性能在含噪声的实际情境下会急剧下降,这是因为实际环境中含有复杂的背景噪声,训练环境无法与之匹配。鉴于此,本文从提高输入样本的质量和提取噪声鲁棒的样本特征两个方面切入,研究了匹配追踪(MP)在实际情境下的环境声音事件识别中的应用。本文的主要工作包括以下几个方面:1)建立环境声音事件信号库。库中收集了实地采集及从Freesound网站获取的环境声音事件信号,包括动物叫声、鸟叫声、昆虫叫声、大自然声及生活中常见事物的声音共5大类45种声音事件。2)对整段信号利用MP进行稀疏表示,以达到降噪的目的。提出利用基于Gabor小波的MP算法来稀疏表示非平稳的环境声音事件样本信号,以提高输入的含噪声样本的质量;研究了利用遗传算法(GA)对MP分解速度进行优化。3)对每帧信号提取MP特征,以期减少识别参数,增强环境声音事件特征的噪声鲁棒性。针对传统的Mel频率倒谱系数(MFCCs)的抗噪性差的缺点,本文提取了信号的频域帧特征:基音频率、符合人耳听觉特性的Mel频率倒谱系数MFCCs-12、MFCCs-26、MFCCs-39和时-频域的帧特征MP-4。在计算MP特征时,考虑到分解速度问题,使用7个原子重构得到的最佳原子参数。4)设计构造了支持向量机(SVM).分类器,基于前述特征建立分类模型,实现对环境声音事件的识别。通过实.验对比特征MFCCs-12、MFCCs-26、 MFCCs-39特征的识别效果,选取MFCCs-12作为识别特征;信号经MP降噪前后,提取MFCCs-12特征的识别效果;基音频率、MFCCs-12和MP-4特征经不同组合后的识别情况;此外,由于测试样本是实地采集的带噪声信号,信噪比各异,因此对测试样本分别添加不同信噪比高斯白噪声,进一步对比检验上一步实验确定的帧特征集的噪声鲁棒性。本文通过对5大类45种环境声音事件进行研究及对比实验,实验结果表明,本文的方法能较好的表征真实情境下的环境声音事件,具有较好的平均识别效果和较强的噪声鲁棒性,可以为进一步研究真实噪声情境下的环境声音事件的识别提供一定的参考。
论文目录
相关论文文献
标签:环境声音事件识别论文; 匹配追踪论文; 遗传算法论文; 信号稀疏表示论文; 降噪论文; 特征提取论文; 支持向量机论文;