匹配追踪在环境声音事件识别中的应用研究

匹配追踪在环境声音事件识别中的应用研究

论文摘要

环境声音中包含着丰富的信息,可为自然保护提供有效的数据支持,应用于机器人导航,家庭自动化,移动终端设备等。研究真实情境下环境声音事件的识别方法有更直接的理论意义和实用价值,然而识别系统性能在含噪声的实际情境下会急剧下降,这是因为实际环境中含有复杂的背景噪声,训练环境无法与之匹配。鉴于此,本文从提高输入样本的质量和提取噪声鲁棒的样本特征两个方面切入,研究了匹配追踪(MP)在实际情境下的环境声音事件识别中的应用。本文的主要工作包括以下几个方面:1)建立环境声音事件信号库。库中收集了实地采集及从Freesound网站获取的环境声音事件信号,包括动物叫声、鸟叫声、昆虫叫声、大自然声及生活中常见事物的声音共5大类45种声音事件。2)对整段信号利用MP进行稀疏表示,以达到降噪的目的。提出利用基于Gabor小波的MP算法来稀疏表示非平稳的环境声音事件样本信号,以提高输入的含噪声样本的质量;研究了利用遗传算法(GA)对MP分解速度进行优化。3)对每帧信号提取MP特征,以期减少识别参数,增强环境声音事件特征的噪声鲁棒性。针对传统的Mel频率倒谱系数(MFCCs)的抗噪性差的缺点,本文提取了信号的频域帧特征:基音频率、符合人耳听觉特性的Mel频率倒谱系数MFCCs-12、MFCCs-26、MFCCs-39和时-频域的帧特征MP-4。在计算MP特征时,考虑到分解速度问题,使用7个原子重构得到的最佳原子参数。4)设计构造了支持向量机(SVM).分类器,基于前述特征建立分类模型,实现对环境声音事件的识别。通过实.验对比特征MFCCs-12、MFCCs-26、 MFCCs-39特征的识别效果,选取MFCCs-12作为识别特征;信号经MP降噪前后,提取MFCCs-12特征的识别效果;基音频率、MFCCs-12和MP-4特征经不同组合后的识别情况;此外,由于测试样本是实地采集的带噪声信号,信噪比各异,因此对测试样本分别添加不同信噪比高斯白噪声,进一步对比检验上一步实验确定的帧特征集的噪声鲁棒性。本文通过对5大类45种环境声音事件进行研究及对比实验,实验结果表明,本文的方法能较好的表征真实情境下的环境声音事件,具有较好的平均识别效果和较强的噪声鲁棒性,可以为进一步研究真实噪声情境下的环境声音事件的识别提供一定的参考。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景及意义
  • 1.2 国内外相关研究
  • 1.2.1 环境声音事件识别的相关研究
  • 1.2.2 匹配追踪的相关研究
  • 1.3 本文研究的主要内容
  • 1.4 论文的结构安排
  • 第二章 音频分类的理论基础
  • 2.1 听觉特性
  • 2.2 识别系统结构
  • 2.3 信号预处理
  • 2.4 音频特征提取
  • 2.4.1 基音频率提取
  • 2.4.2 Mel频率倒谱系数
  • 2.5 本章小结
  • 第三章 基于匹配追踪的信号稀疏表示方法分析
  • 3.1 过完备原子字典
  • 3.1.1 过完备原子字典描述
  • 3.1.2 过完备原子字典的形成
  • 3.2 MP信号展开
  • 3.3 MP算法的优化
  • 3.3.1 利用遗传算法改进MP
  • 3.3.2 优化寻找最佳匹配时频原子
  • 3.3.3 算法分析
  • 3.4 本章小结
  • 第四章 识别模型
  • 4.1 概述
  • 4.2 支持向量机(Support Vector Machine,SVM)
  • 4.2.1 SVM分类原理
  • 4.2.2 SVM参数选择与性能评价
  • 4.3 本章小结
  • 第五章 系统实现与实验结果分析
  • 5.1 声音数据库
  • 5.2 环境声音事件的分类
  • 5.2.1 MP噪声消除
  • 5.2.2 特征选择
  • 5.2.3 噪声对分类的影响
  • 5.3 结果分析
  • 5.4 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 个人简历、在读期间研究成果以及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    匹配追踪在环境声音事件识别中的应用研究
    下载Doc文档

    猜你喜欢