基于时间编码的环境声音识别

基于时间编码的环境声音识别

论文摘要

随着应用需求的增加,对声音识别的研究不再只是局限于语音识别,人们开始把目光投向非语音的环境声音识别。环境声音在众多领域有重要应用,如辅助机器人技术,监督安全领域,自动导航仪等。环境信息包含丰富的信息,研究环境声音对了解环境,预测环境的变化及改善环境与人类的关系具有重要意义。然而环境声音背景噪声大,频率范围宽及所需模版信息量大的特点以及现有技术的制约限制了对环境声音的进一步研究。为此,本文从声音去噪,声音数据处理及声音分类识别算法等方面进行研究,以提高环境声音分类识别的准确性。本文的研究包括以下内容:1)环境声音信号去噪:使用改进的小波阈值去噪法对声音进行去噪,以提高声音识别的准确性。该方法使用折衷的阈值函数,克服了软阈值函数固定偏差和硬阈值函数不连续的缺点。使用10种鸟叫声进行实验,用信噪比和均方误差作为评估标准,比较软阈值函数,硬阈值函数和折衷阈值函数的去噪效果。2)特征提取:提出用时间编码信号处理与识别(TESPAR)算法对环境声音进行处理。TESPAR用D/S描述符描述波形,用矢量量化算法构造一个TESPAR字符表,根据字符表提取波形的字符流,最后生成TESPAR矩阵。使用TESPAR算法对二十种环境声音进行分类识别,比较使用不同TESPAR矩阵的识别效果。通过实验选择表征特征能力较好的log(A)矩阵。此外还测试TESPAR在不同信噪比下的识别性能。3)分类识别:TESPAR算法对环境声音进行处理会得到固定的TESPAR矩阵,和人工神经网络使用定长向量训练的要求很匹配。而且人工神经网络是一种客观实用的分类方法。设计构造快速人工神经网络(FANN),基于上述的小波去噪,TESPAR算法实现对环境声音的识别。对使用FANN方法和原型方法的识别效果进行对比。通过以上的研究可以得出,改进的小波阈值去噪法可以对环境声音进行有效去噪,使用TESPAR和人工神经网络结合的模型对环境声音进行分类识别可以取得良好的分类识别效果,具有较好的抗噪性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究背景与意义
  • 1.2 生态环境声音分类和识别研究现状
  • 1.3 本文主要工作
  • 1.4 论文结构
  • 第二章 语音信号去噪
  • 2.1 现有语音信号去噪的原理及其比较
  • 2.1.1 傅里叶变换
  • 2.1.2 短时傅里叶变换
  • 2.1.3 小波变换
  • 2.2 小波去噪基本原理和步骤
  • 2.2.1 小波去噪基本原理
  • 2.2.2 小波去噪的阈值处理
  • 2.2.3 改进的阈值法去噪
  • 2.3 小结
  • 第三章 时间编码信号处理与识别算法
  • 3.1 环境声音信号特征提取技术
  • 3.2 时间编码信号处理与识别算法
  • 3.2.1 TESPAR
  • 3.2.2 LBG矢量量化
  • 3.2.3 TESPAR编码
  • 3.2.4 TESPAR矩阵
  • 3.3 传统的特征提取方法
  • 3.3.1 线性预测倒谱系数LPCC
  • 3.3.2 MFCC
  • 3.4 小结
  • 第四章 环境声音识别分类器
  • 4.1 分类器
  • 4.2 人工神经网络
  • 4.2.1 多层感知器
  • 4.2.2 BP算法
  • 4.2.3 分类决策
  • 4.3 原型方法
  • 4.4 小结
  • 第五章 实验与结果分析
  • 5.1 数据集
  • 5.2 小波去噪
  • 5.2.1 小波去噪评估标准
  • 5.2.2 小波去噪实验结果分析
  • 5.3 K-折交叉验证法
  • 5.4 TESPAR参数设置
  • 5.5 分类器选择
  • 5.5.1 快速人工神经网络
  • 5.5.2 原型方法
  • 5.6 实验结果与分析
  • 5.7 小结
  • 总结与展望
  • 参考文献
  • 致谢
  • 个人简历,在读期间研究成果及发表论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于时间编码的环境声音识别
    下载Doc文档

    猜你喜欢