自动语音识别中的噪声鲁棒性方法

自动语音识别中的噪声鲁棒性方法

论文摘要

众所周知,在噪声环境下如果我们不采取任何措施,那么自动语音识别系统的性能将会大幅下降。本文的主要目标是在面对各种噪声带来的负面影响时,如何增强识别系统的鲁棒性。噪声鲁棒性方法大体上可以分为两大类:特征域方法和模型域方法。本文对这两类方法均开展了深入的研究,主要创新点如下:首先,我们提出一种新的基于隐式模型的特征规整算法,即倒谱形状规整(CSN)算法。我们观察到在噪声环境下特征分布的形状相比于干净环境变化很大,CSN通过引入一个指数因子来达到对倒谱分布形状规整的目的。这个新方法被证明比传统的HEQ和HOCMN方法更加有效,尤其是在低信噪比情况下。接着,我们转到另一种新的基于显式模型的特征补偿方法,即分段线性近似(PLA)方法。通过对环境模型的分段线性近似,可以比传统的VTS和MAX这两种方法得到更为精确的近似,同时给出了基于MLE的噪声参数估计和基于MMSE的干净语音估计的相关理论推导,此外实验表明针对当前句子的不同段采用不同的分段近似方式能进一步带来性能的提升。我们不仅在语音识别中验证了PLA方法的有效性,还将此方法在语音增强中加以应用,主客观测试都取得了较好的效果。但是PLA方法并不完美,它最大的缺陷在于所有理论推导都假设在对数谱域滤波器组各个通道之间互不相关。因此从另一个精确近似的角度,我们提出了一种新的基于高阶矢量泰勒展开(HOVTS)的方法。HOVTS具有以下优点:1.环境模型中同时考虑了加性噪声和信道畸变,2.对非线性环境模型可以进行任意高阶近似,3.滤波器组各通道之间的相关性可以加以考虑。最后,我们考察了HMM经过区分性训练之后的噪声鲁棒性。作为预备知识,先介绍了我们提出的区分性训练新准则,即最小化散度(MD)准则,实验表明在干净环境下小任务和大任务上MD准则性能均优于时下流行的MPE准则。然后讨论了噪声鲁棒性区分性训练的若干技术细节,包括MD准则和MWE/MPE准则的优劣,如何设计ML基线系统以及如何处理静音/背景模型等等。以上所有新方法的实验都是在小任务Aurora2和Aurora3上完成,这两个数据库都是连续数字串任务,并且是专门为验证噪声鲁棒性方法而设计。为了实验的完整性,我们也比较了不同技术在LVCSR大库Aurora4上的优劣。初步实验再次表明,LVCSR的噪声鲁棒性至今仍然是一个很难的开放性问题。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 语音识别简介
  • 1.2 基于统计建模框架的语音识别
  • 1.2.1 特征提取及处理
  • 1.2.2 声学模型
  • 1.2.3 语言模型
  • 1.2.4 解码搜索
  • 1.3 章节组织结构
  • 第2章 噪声鲁棒性方法回顾
  • 2.1 引言
  • 2.2 总体回顾
  • 2.3 具体介绍
  • 2.3.1 鲁棒性特征
  • 2.3.2 信号和特征增强
  • 2.3.3 模型补偿
  • 2.3.4 丢失特征理论
  • 2.3.5 多样训练
  • 2.4 本章小结
  • 第3章 倒谱形状规整方法
  • 3.1 引言
  • 3.2 特征规整基本问题
  • 3.2.1 直接规整和间接规整
  • 3.2.2 分布匹配和矩匹配
  • 3.3 倒谱形状规整方法介绍
  • 3.3.1 语音特征分布分析
  • 3.3.2 CSN算法描述
  • 3.4 倒谱时域平滑
  • 3.5 本章小结
  • 第4章 PLA特征补偿方法在语音识别及语音增强中的应用
  • 4.1 引言
  • 4.2 基于PLA的特征补偿方法
  • 4.3 PLA方法理论推导
  • y(y)'>4.3.1 py(y)
  • x[x丨y]和Ex[x2丨y]'>4.3.2 Ex[x丨y]和Ex[x2丨y]
  • n[n丨y]和En[n2丨y]'>4.3.3 En[n丨y]和En[n2丨y]
  • 4.3.4 一些特例的讨论
  • 4.4 PLA在语音增强中的应用
  • 4.4.1 特征提取
  • 4.4.2 波形重建
  • 4.5 本章小结
  • 第5章 HOVTS特征补偿方法在语音识别中的应用
  • 5.1 引言
  • 5.2 基于HOVTS的特征补偿方法
  • 5.2.1 前提假设
  • 5.2.2 流程介绍
  • 5.3 HOVTS方法理论推导
  • y(i)'>5.3.1 μy(i)
  • y2(i,j)'>5.3.2 σy2(i,j)
  • zy2(i,j)'>5.3.3 σzy2(i,j)
  • ny2(i,j)'>5.3.4 σny2(i,j)
  • 5.4 针对MMSE部分的算法改进
  • 5.5 本章小结
  • 第6章 区分性训练的声学模型在噪声鲁棒性方面的探究
  • 6.1 引言
  • 6.2 经典区分性训练方法回顾
  • 6.2.1 贝叶斯决策理论
  • 6.2.2 MMI准则
  • 6.2.3 MCE准则
  • 6.2.4 MWE/MPE准则
  • 6.2.5 EBW优化算法
  • 6.3 MD准则介绍
  • 6.3.1 最小化错误训练的统一框架
  • 6.3.2 KLD距离计算
  • 6.3.3 基于词图的MD准则实现
  • 6.4 MD准则改进
  • 6.4.1 构造弱性辅助函数
  • 6.4.2 EBW算法实现
  • 6.5 区分性训练的噪声鲁棒性问题
  • 6.6 本章小结
  • 第7章 实验部分
  • 7.1 引言
  • 7.2 数据库介绍
  • 7.2.1 TIDigits数据库
  • 7.2.2 Aurora2数据库
  • 7.2.3 Aurora3数据库
  • 7.2.4 Aurora4数据库
  • 7.2.5 Switchboard数据库
  • 7.2.6 TIMIT数据库
  • 7.3 前后端基本配置
  • 7.4 CSN方法实验结果及分析
  • 7.4.1 CSN方法与其他规整方法比较
  • 7.4.2 CSN方法改进
  • 7.5 PLA方法实验结果及分析
  • 7.5.1 语音识别方面
  • 7.5.2 语音增强方面
  • 7.6 HOVTS方法实验结果及分析
  • 7.6.1 HOVTS基本算法
  • 7.6.2 针对MMSE部分的算法改进
  • 7.7 区分性训练相关实验结果及分析
  • 7.7.1 基于MD准则的区分性训练
  • 7.7.2 基于MD准则改进的区分性训练
  • 7.7.3 区分性训练的噪声鲁棒性
  • 7.8 本章小结
  • 第8章 总结及展望
  • 8.1 论文主要贡献
  • 8.2 后续研究方向
  • 插图索引
  • 表格索引
  • 参考文献
  • 致谢
  • 附录A CSN方法中函数单调性证明
  • 附录B 对数谱域环境模型推导过程
  • 附录C 噪声信道估计推导过程
  • 个人简历及在读期间发表的学术论文
  • 相关论文文献

    • [1].模型压缩中的对抗鲁棒性实验分析[J]. 陕西师范大学学报(自然科学版) 2020(02)
    • [2].W-态的纠缠鲁棒性和广义纠缠鲁棒性[J]. 陕西师范大学学报(自然科学版) 2016(05)
    • [3].生物鲁棒性对电磁防护仿生的借鉴[J]. 高电压技术 2017(08)
    • [4].鲁棒性优化在质子调强放射治疗中的应用[J]. 中国医学物理学杂志 2020(11)
    • [5].电力系统优化控制策略的鲁棒性评估[J]. 电网技术 2016(04)
    • [6].基于智能算法的双目标鲁棒性项目调度[J]. 系统管理学报 2015(03)
    • [7].考虑灵敏度区域的多目标鲁棒性优化算法[J]. 控制理论与应用 2016(02)
    • [8].多属性决策的鲁棒性分析方法[J]. 海军工程大学学报 2016(03)
    • [9].脉胞菌节律调控网络的鲁棒性[J]. 科技创新导报 2015(05)
    • [10].列车运行图可恢复鲁棒性优化模型[J]. 铁道学报 2013(10)
    • [11].船舶变速恒频风电机组电压的鲁棒性控制[J]. 舰船科学技术 2018(12)
    • [12].负载作用下相互依存网络的鲁棒性分析[J]. 甘肃科学学报 2018(04)
    • [13].量子信道对纠缠鲁棒性的影响[J]. 吉林大学学报(理学版) 2016(04)
    • [14].基于集中分散式缓冲的装备项目调度鲁棒性优化研究[J]. 管理观察 2016(26)
    • [15].量子信道对广义纠缠鲁棒性的影响[J]. 山东大学学报(理学版) 2016(11)
    • [16].基于关键链技术的项目鲁棒性优化调度方法研究[J]. 科技管理研究 2013(06)
    • [17].伯努利节点网络模型的拓扑鲁棒性分析方法[J]. 电子学报 2011(07)
    • [18].多星联合鲁棒性调度模型研究[J]. 运筹与管理 2008(02)
    • [19].基于鲁棒性目标的关键链项目调度优化[J]. 系统工程学报 2015(01)
    • [20].鲁棒性项目调度中缓冲设置方法[J]. 控制与决策 2014(02)
    • [21].成像卫星鲁棒性调度策略研究[J]. 系统工程与电子技术 2010(01)
    • [22].鲁棒性有源头枕系统的设计方法[J]. 应用声学 2018(05)
    • [23].城市轨道交通网络鲁棒性仿真[J]. 计算机仿真 2018(10)
    • [24].一种针对不确定性结构的区间鲁棒性优化方法[J]. 中国科学:技术科学 2019(07)
    • [25].基于蒙特卡罗方法的控制律鲁棒性验证[J]. 系统仿真学报 2008(S2)
    • [26].基于复杂网络理论的企业营销网络鲁棒性评估[J]. 数学的实践与认识 2018(21)
    • [27].指控组织鲁棒性理论的研究[J]. 信息系统工程 2016(08)
    • [28].生物鲁棒性的控制论方法[J]. 生物物理学报 2009(S1)
    • [29].基于误差回馈机制的船舶机组电压鲁棒性研究[J]. 舰船科学技术 2019(20)
    • [30].基于两层鲁棒性交叉映射的大数据融合算法[J]. 计算机仿真 2016(10)

    标签:;  ;  ;  ;  ;  ;  ;  

    自动语音识别中的噪声鲁棒性方法
    下载Doc文档

    猜你喜欢