基于MFCC和GMM的异常声音识别算法研究

基于MFCC和GMM的异常声音识别算法研究

论文摘要

异常声音识别是声音识别系统中的一种,是应用音频波形中反映异常声音的特征参数,自动识别异常声音的一种技术。声音识别系统具有计算效率高,复杂度小,采集设备简单,成本低,而且能更好的保护人们的隐私等优点,它还可以和视频监控系统协作。因此,声音识别技术是具有广泛的应用前景,值得很多人投身其研究中。本文针对异常声音识别系统低识别率和高复杂度的问题,将梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,简称MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(Gaussian Mixture Model,简称GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。分类器的平均识别率可达到90%以上,并且计算复杂度小。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性。在性能研究方面,分析了不同特征参数下异常声音识别系统的识别率,获得特征参数的性能与系统的识别率相关的结果;此外还分析不同高斯混合阶数下异常识别系统的识别率,获得高斯密度个数的选择与训练音频数据量相关的结果;最后对比分析了最大期望(Expectation Maxinum, EM)和最小描述长度(Minimum Description Length, MDL)算法,结果表明MDL算法能够有更好的应用空间。在系统构建方面,本文用MATLAB实现了一个完整的异常声音识别系统,包括音频信号的预处理,特征提取以及分类器的训练和识别。在预处理模块中,对原始音频进行了归一化,预加重,重叠分帧等处理;在特征提取模块中,提取了MFCC,过零率(The Zero-Crossing Rate, ZCR),短时能量(Short-Energy),对数频率倒谱系数(The Log Frequency Cepstral Coefficients, LFCC)等特征参数。在模型训练与识别模块中,使用了高斯混合模型作为分类器,它与其他分类器相比,能更好的分辨出异常声音的差别。该系统实现了对8种异常声音的分类识别,能够得到较高的识别率,而且系统性能好,方法简单,计算效率高,能够保护人们的隐私。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景和意义
  • 1.2 异常声音识别技术
  • 1.2.1 异常声音识别系统组成
  • 1.2.2 异常声音识别系统评价标准
  • 1.2.3 国内外研究的现状
  • 1.3 本文的主要工作
  • 第2章 异常声音的特征提取
  • 2.1 音频信号的特征提取
  • 2.1.1 过零率参数的提取
  • 2.1.2 短时帧能量参数的提取
  • 2.1.3 短时平均幅度参数的提取
  • 2.1.4 小波子带能量参数的提取
  • 2.1.5 MFCC参数的提取
  • 2.1.6 MFCC差分参数的提取
  • 2.1.7 PLPC参数的提取
  • 2.1.8 LFCC参数的提取
  • 2.1.9 特征矢量
  • 2.2 高斯混合模型
  • 2.2.1 高斯混合模型的基本原理
  • 2.2.2 高斯混合模型的参数估计
  • 2.2.3 EM算法和MDL算法
  • 2.3 本章小结
  • 第3章 基于MFCC和GMM的异常声音识别算法
  • 3.1 算法简介
  • 3.2 算法设计
  • 3.2.1 预处理
  • 3.2.2 特征矢量
  • 3.2.3 训练模型
  • 3.2.4 识别算法
  • 3.3 算法的实现与界面操作
  • 3.3.1 实验的软硬件环境
  • 3.3.2 异常声音库
  • 3.3.3 软件界面使用
  • 3.4 本章小结
  • 第4章 异常声音识别算法仿真测试
  • 4.1 高斯混合阶数测试与分析
  • 4.2 复杂度测试与分析
  • 4.3 特征参数测试与分析
  • 4.4 EM与MDL对比分析
  • 4.5 性能比较
  • 4.6 本章小结
  • 总结与展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文及科研成果
  • 相关论文文献

    • [1].我国税收优惠对集成电路企业发展的效应分析——基于动态面板广义矩(GMM)估计[J]. 税务研究 2020(02)
    • [2].基于GMM托肯配比相似度校正得分的说话人识别[J]. 清华大学学报(自然科学版) 2017(01)
    • [3].金融集聚、人力资本与经济增长——基于省际动态面板数据差分GMM分析[J]. 山东工商学院学报 2017(01)
    • [4].制造业企业特征、融资约束和研发支出——基于系统GMM动态面板的估计[J]. 财会通讯 2017(15)
    • [5].一种基于GMM和多项式拟合的语音编码改进算法[J]. 南京师范大学学报(工程技术版) 2017(02)
    • [6].对外贸易对城市人口规模的影响——基于我国百个地级市的系统GMM研究[J]. 国际商务(对外经济贸易大学学报) 2016(02)
    • [7].人力资本增长对我国工业资本回报率提升的影响——基于地区与行业视角的GMM方法[J]. 软科学 2016(05)
    • [8].价值链低端生产是否限制了中国的资本回报率——基于省级动态面板数据GMM方法[J]. 国际贸易问题 2015(06)
    • [9].我国人口出生率及其影响因素研究——基于动态GMM模型和门限模型的实证分析[J]. 价格理论与实践 2019(11)
    • [10].基于GMM改进的信息系统安全态势实时预测研究[J]. 计算机应用与软件 2017(02)
    • [11].财政政策对产业结构优化的影响——基于我国省级面板数据的系统GMM分析[J]. 公共财政研究 2017(03)
    • [12].信息化影响新型城镇化的经验估计与机制分析——基于GMM动态面板模型[J]. 经济与社会发展 2017(03)
    • [13].基于系统GMM的国防支出与政府债务关系研究[J]. 天津大学学报(社会科学版) 2015(02)
    • [14].加速折旧促进制造业投资研究——基于GMM估算的实证分析[J]. 会计之友 2015(15)
    • [15].政府规模对经济增长影响效应的GMM评价——基于市级面板数据的实证分析[J]. 北京工业大学学报(社会科学版) 2015(05)
    • [16].综合经营、专业化与健康保险业务发展——基于系统GMM估计的动态面板模型分析[J]. 保险研究 2014(03)
    • [17].基于GMM的说话人识别系统设计与实现[J]. 微处理机 2014(03)
    • [18].新经济地理视角下产业集聚对税收竞争的影响——基于GMM估计的省级动态面板数据分析[J]. 生产力研究 2014(06)
    • [19].金融发展、融资约束与环保投资——基于中国省级面板数据的GMM检验[J]. 现代经济信息 2014(20)
    • [20].地方政府腐败会影响私人投资积极性吗?——基于动态面板模型的系统GMM分析[J]. 南方经济 2012(02)
    • [21].基于GMM的黄瓜病害图像建模[J]. 安徽农业科学 2011(34)
    • [22].城市水价预测长期边际成本模型的GMM参数估计[J]. 自然资源学报 2010(09)
    • [23].基于聚类优化GMM提高说话人识别性能的研究[J]. 计算机技术与发展 2009(04)
    • [24].基于GMM的说话人识别研究与实践[J]. 计算机与数字工程 2009(06)
    • [25].利率期限结构模型估计中的GMM方法述评[J]. 统计与决策 2008(09)
    • [26].产业结构变化背景下创业对经济增长的影响——基于2000—2015年省际面板数据的GMM分析[J]. 湖北经济学院学报(人文社会科学版) 2019(10)
    • [27].东道国基础设施水平对我国对外直接投资的影响——基于“一带一路”国家的系统GMM研究[J]. 对外经贸 2017(03)
    • [28].基于多特征融合GMM的阴影检测策略研究[J]. 河北工业科技 2014(05)
    • [29].中国空气污染库兹涅茨曲线的实证研究——基于动态面板系统GMM与门限模型检验[J]. 经济问题 2014(04)
    • [30].基于GMM的说话人识别[J]. 广西物理 2011(01)

    标签:;  ;  ;  ;  ;  

    基于MFCC和GMM的异常声音识别算法研究
    下载Doc文档

    猜你喜欢