基于类间权值调整GMM模型的场景语音分类研究

基于类间权值调整GMM模型的场景语音分类研究

论文摘要

近年来语音信号处理已成为信号处理中比较引人注目的研究领域。但是当前的研究中,无论是语音识别还是检索,针对的都是单一类别的音频文件,而在网络实际应用中,更多的情况是各种类别混合在一起的。为了完成对这一类数据的识别和检索,就需要先对它们进行分类来提取出文件中各个不同类别的部分,然后再按照单一类别的情况进行处理,而这种分类技术就被统称为场景语音分类技术。结合相关文献对场景语音分类算法的研究,本文得出目前这一领域的研究重点主要集中在:一是尽量选取能够在统计意义下有较高区分性的特征,并且选取的这一特征应兼有低计算量的特点以符合实时语音处理的要求;二是在搭建声学模型时,提出新的模型算法或者在原有算法中加以改进,提高分类的准确率和执行效率使得系统达到高稳定性。从这一思路出发,在特征的选取上,文中先对三类音频:语音、音乐及噪音文件分别完成时域及频域的多种特征的提取,然后对这些特征在帧层次及片段层次的分布进行统计,最后通过分析得出多维特征子带能量比比起其他特征来说更能从帧层次上完成对三类音频的分类,同时得出片段层次上没有相关特征能够完成分类要求。在模型的选取上,由于HMM模型和由它衍生而来的GMM模型能统计地吸收发音的声学特性和时间上的变动。因此,在现有的各种分类识别系统中,它们已经成为了最佳的识别模型;又由于GMM模型不像HMM那样通过状态转移概率约束声学特征类的时序变化,使得GMM比HMM的计算量要小的多,所以GMM比起后者更适合进行实时处理。基于上述考虑,本文选用GMM模型来用于场景语音分类。基于对传统GMM模型各个实现环节的深入研究,本文提出了一种基于类间权值调整的GMM语音分类算法。由于传统的GMM模型只考虑类内数据之间对分类建模的影响,而忽视了不同类间数据可能存在的相关性。这种相关性的存在可能会在类间数据的识别分类过程中产生一定的干扰,导致分类中出现误判。为了避免产生误判,本文在传统的GMM模型参数进行类间权值调整,通过对那些容易产生干扰的两类GMM模型参数对,可以通过对其权值进行削弱来降低它们对识别结果的影响。反之,对于那些彼此之间接近相互独立的,容易区分两类数据的参数对,可以通过对其权值进行加强来提升它们对识别结果的影响。由于本文在特征选取环节上只从帧层次上选取了子带能量比这一特征来进行GMM建模,而没有采用片段层次的特征,又由于最后的判决结果是针对于每一片段来进行的,这就导致了在实验中的两类模型得分近似一致而难以进行区分。为了弥补这一不足,本文对传统的似然判决函数进行优化,实现了对这类错误所在片段在最终判决上的平滑处理。最后对包含三类的混合文件分别在传统的GMM模型、类间权值调整GMM模型以及加入优化似然函数后的类间权值调整GMM模型下进行对比实验并采用F-measure对三类系统下的分类效果进行评价,实验结果表明相较于传统的GMM模型,本文提出的类间权值调整GMM模型用于语音分类的效果更好,同时如果进一步加上优化后的判决似然函数,识别性能可得到进一步的改善。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究的目的及意义
  • 1.2 场景语音分类的发展过程和研究现状
  • 1.2.1 声学特征的选取
  • 1.2.2 模型的选择
  • 1.3 系统框架图及章节安排
  • 第2章 预处理环节及特征提取
  • 2.1 预处理环节
  • 2.2 特征提取
  • 2.2.1 帧特征介绍及分析
  • 2.2.2 clip特征介绍及分析
  • 2.3 本章小结
  • 第3章 基于类间权值调整的GMM模型
  • 3.1 GMM模型基本原理
  • 3.2 EM算法简介
  • 3.3 GMM模型用于场景语音分析的具体实现
  • 3.4 混合高斯模型数M的确定
  • 3.5 类间相似度的引入
  • 3.6 本章小结
  • 第4章 优化似然函数
  • 4.1 问题的提出
  • 4.2 传统似然度原理介绍
  • 4.3 判决环节的实现
  • 4.4 优化似然比概念
  • 4.5 分割算法的实现
  • 4.6 本章小结
  • 第5章 实验结果及分析
  • 5.1 实验环境简介
  • 5.2 类间调整系数的确定
  • 5.3 优化似然函数的检测实验
  • 5.4 不同方法之间的对比实验
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].我国税收优惠对集成电路企业发展的效应分析——基于动态面板广义矩(GMM)估计[J]. 税务研究 2020(02)
    • [2].基于GMM托肯配比相似度校正得分的说话人识别[J]. 清华大学学报(自然科学版) 2017(01)
    • [3].金融集聚、人力资本与经济增长——基于省际动态面板数据差分GMM分析[J]. 山东工商学院学报 2017(01)
    • [4].制造业企业特征、融资约束和研发支出——基于系统GMM动态面板的估计[J]. 财会通讯 2017(15)
    • [5].一种基于GMM和多项式拟合的语音编码改进算法[J]. 南京师范大学学报(工程技术版) 2017(02)
    • [6].对外贸易对城市人口规模的影响——基于我国百个地级市的系统GMM研究[J]. 国际商务(对外经济贸易大学学报) 2016(02)
    • [7].人力资本增长对我国工业资本回报率提升的影响——基于地区与行业视角的GMM方法[J]. 软科学 2016(05)
    • [8].价值链低端生产是否限制了中国的资本回报率——基于省级动态面板数据GMM方法[J]. 国际贸易问题 2015(06)
    • [9].我国人口出生率及其影响因素研究——基于动态GMM模型和门限模型的实证分析[J]. 价格理论与实践 2019(11)
    • [10].基于GMM改进的信息系统安全态势实时预测研究[J]. 计算机应用与软件 2017(02)
    • [11].财政政策对产业结构优化的影响——基于我国省级面板数据的系统GMM分析[J]. 公共财政研究 2017(03)
    • [12].信息化影响新型城镇化的经验估计与机制分析——基于GMM动态面板模型[J]. 经济与社会发展 2017(03)
    • [13].基于系统GMM的国防支出与政府债务关系研究[J]. 天津大学学报(社会科学版) 2015(02)
    • [14].加速折旧促进制造业投资研究——基于GMM估算的实证分析[J]. 会计之友 2015(15)
    • [15].政府规模对经济增长影响效应的GMM评价——基于市级面板数据的实证分析[J]. 北京工业大学学报(社会科学版) 2015(05)
    • [16].综合经营、专业化与健康保险业务发展——基于系统GMM估计的动态面板模型分析[J]. 保险研究 2014(03)
    • [17].基于GMM的说话人识别系统设计与实现[J]. 微处理机 2014(03)
    • [18].新经济地理视角下产业集聚对税收竞争的影响——基于GMM估计的省级动态面板数据分析[J]. 生产力研究 2014(06)
    • [19].金融发展、融资约束与环保投资——基于中国省级面板数据的GMM检验[J]. 现代经济信息 2014(20)
    • [20].地方政府腐败会影响私人投资积极性吗?——基于动态面板模型的系统GMM分析[J]. 南方经济 2012(02)
    • [21].基于GMM的黄瓜病害图像建模[J]. 安徽农业科学 2011(34)
    • [22].城市水价预测长期边际成本模型的GMM参数估计[J]. 自然资源学报 2010(09)
    • [23].基于聚类优化GMM提高说话人识别性能的研究[J]. 计算机技术与发展 2009(04)
    • [24].基于GMM的说话人识别研究与实践[J]. 计算机与数字工程 2009(06)
    • [25].利率期限结构模型估计中的GMM方法述评[J]. 统计与决策 2008(09)
    • [26].产业结构变化背景下创业对经济增长的影响——基于2000—2015年省际面板数据的GMM分析[J]. 湖北经济学院学报(人文社会科学版) 2019(10)
    • [27].东道国基础设施水平对我国对外直接投资的影响——基于“一带一路”国家的系统GMM研究[J]. 对外经贸 2017(03)
    • [28].基于多特征融合GMM的阴影检测策略研究[J]. 河北工业科技 2014(05)
    • [29].中国空气污染库兹涅茨曲线的实证研究——基于动态面板系统GMM与门限模型检验[J]. 经济问题 2014(04)
    • [30].基于GMM的说话人识别[J]. 广西物理 2011(01)

    标签:;  ;  ;  ;  

    基于类间权值调整GMM模型的场景语音分类研究
    下载Doc文档

    猜你喜欢