基于动态贝叶斯网络的连续语音识别研究

基于动态贝叶斯网络的连续语音识别研究

论文摘要

隐马尔科夫模型(HMM)是一个简单、有效的统计模型,成功应用于语音识别中,但由于其建模时假设条件与实际不相符,很难描述出语音的动态特性。动态贝叶斯网络(DBN)具有易解释、易扩展、易分解的特性,具有很强的推理和学习能力,对语音时序性的建模能力强,可以更好地描述语音中的动态性。本文在研究DBN推理和学习方法的基础上,提出了四种基于动态贝叶斯网络(DBN)的连续语音识别改进模型,具体研究成果如下:(1)针对音子DBN模型中音子单元颗粒度大、区分性差,导致识别时插入错误多的问题,本文提出了一种次音子DBN模型。该模型首先将音子单元细分为次音子,在音子DBN模型上增加了次音子变量和次音子转移变量;然后通过分析确定了变量相关性的变化规律。因此次音子DBN模型可以更好地描述语音链多级结构的细节,实现对音子内部的动态变化性的精确建模。实验结果表明,与音子DBN模型相比,该模型较好地改善了连续语音识别系统的识别正确率和准确率。(2)针对大词汇量语音识别构建词转移变量决策树复杂度高,模型对词汇量缺乏适应性的问题,本文提出了一种控制层变化的次音子DBN模型。该模型在构建词典时为每一个词设定一个结束标记,相应地改变模型结构中词转移变量的父节点。词结束标记的设定减少了词中音子个数的差别所引起的差异性,降低了构建决策树的复杂度,训练和识别时参数读取的时间也相应减少。实验结果表明,该模型在不降低识别性能的情况下,在一定程度上提高了训练、识别的速度。(3)针对连续语音中普遍存在的协同发音现象,本文提出了一种新颖的三音子DBN模型。该模型在控制层变化的次音子DBN模型基础上,引入能较好地描述语音中上下文相关性的前后音子变量。由于三音子个数很多,采用了基于发音特点的判决树方法对不同的三音子进行聚类,确保三音子可以得到稳健的参数估计值。实验结果表明该模型可以提高大词汇量连续语音的识别性能。(4)针对训练环境和识别环境失配导致模型性能下降的问题,本文提出了一种引入离散噪声变量的DBN模型。该模型在DBN框架上引入一个离散噪声变量,该变量可以隐式地对不同信噪比的混合语音训练集进行分类训练。实验结果表明,该模型提高了DBN模型在不同信噪比环境的稳健性和适应性,可以有效改善混合训练集上识别器的识别性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 连续语音识别系统概述
  • 1.1.1 研究背景
  • 1.1.2 关键技术
  • 1.2 连续语音识别的发展现状
  • 1.2.1 特征提取
  • 1.2.2 声学模型
  • 1.2.3 语言模型
  • 1.2.4 搜索算法
  • 1.3 基于DBN 的连续语音识别的发展现状
  • 1.3.1 引入辅助变量的DBN
  • 1.3.2 基于发音特征的DBN
  • 1.3.3 多流DBN
  • 1.4 论文的主要工作和组织安排
  • 1.4.1 论文的研究内容
  • 1.4.2 论文的结构安排
  • 第二章 DBN 及DBN 推理和学习
  • 2.1 DBN 的相关概念
  • 2.2 BN 的推理
  • 2.2.1 树状图推理
  • 2.2.2 一般拓扑结构图的推理
  • 2.3 DBN 推理
  • 2.3.1 Frontier 算法
  • 2.3.2 Interface 算法
  • 2.3.3 Islands 算法
  • 2.4 DBN 学习
  • 2.5 小结
  • 第三章 次音子DBN 语音识别模型
  • 3.1 决策树
  • 3.2 音子DBN 模型
  • 3.2.1 交换父节点
  • 3.2.2 模型结构及相关定义
  • 3.2.3 控制层
  • 3.2.4 观测层
  • 3.3 次音子DBN 模型
  • 3.3.1 次音子
  • 3.3.2 模型结构及其参数
  • 3.3.3 相关性变化的过程
  • 3.4 控制层变化的次音子DBN 模型
  • 3.4.1 模型结构及其参数
  • 3.4.2 控制层变化后构建WT t 的决策树
  • 3.5 三音子DBN 模型
  • 3.5.1 三音子
  • 3.5.2 模型结构及其参数
  • 3.6 实验结果与性能分析
  • 3.6.1 评价方法
  • 3.6.2 MFCC 的提取
  • 3.6.3 小词汇的连续语音识别的实验结果及分析
  • 3.6.4 汉语的连续语音识别的实验结果及分析
  • 3.7 小结
  • 第四章 引入离散噪声变量的DBN 语音识别模型
  • 4.1 辅助变量
  • 4.1.1 标准信息与辅助信息
  • 4.1.2 辅助噪声变量
  • 4.2 引入离散噪声变量的词DBN 模型
  • 4.3 其他引入离散噪声变量的DBN 模型
  • 4.3.1 引入离散噪声变量的次音子DBN 模型
  • 4.3.2 引入离散噪声变量的三音子DBN 模型
  • 4.4 实验
  • 4.4.1 词DBN 模型和次音子DBN 模型的识别性能
  • 4.4.2 引入离散噪声变量的DBN 模型的识别性能
  • 4.5 小结
  • 结束语
  • 参考文献
  • 作者简历 攻读硕士学位期间完成的主要工作
  • 致谢
  • 相关论文文献

    • [1].基于贝叶斯网络的交通拥堵实时预测[J]. 冶金管理 2019(21)
    • [2].贝叶斯网络在水利工程中的应用[J]. 东北水利水电 2020(04)
    • [3].基于贝叶斯网络的静态话题追踪模型[J]. 数据分析与知识发现 2020(Z1)
    • [4].一种新型动态贝叶斯网络分析方法[J]. 中国机械工程 2020(12)
    • [5].组合数据下贝叶斯网络构建算法研究[J]. 电子技术与软件工程 2020(09)
    • [6].基于贝叶斯网络的交通事故致因路径分析[J]. 智能城市 2020(17)
    • [7].基于贝叶斯网络的虚拟学习模块[J]. 计算机技术与发展 2020(08)
    • [8].有限总体中总体数量的贝叶斯预测(英文)[J]. 数学杂志 2018(05)
    • [9].贝叶斯网络在入侵检测中的应用[J]. 中国新通信 2017(09)
    • [10].基于贝叶斯网络的设备故障诊断方法研究[J]. 中国标准化 2017(14)
    • [11].基于贝叶斯网络的停车场主动引导算法研究[J]. 农机使用与维修 2017(10)
    • [12].基于分层动态贝叶斯网络的武器协同运用[J]. 舰船电子工程 2015(12)
    • [13].贝叶斯因果图的构建与应用[J]. 统计与决策 2016(07)
    • [14].基于信息融合的贝叶斯网络毁伤评估方法[J]. 四川兵工学报 2015(04)
    • [15].基于贝叶斯网络的地铁施工风险管理分析[J]. 四川建材 2015(03)
    • [16].贝叶斯网络和聚类分析在肾虚证中的比较研究[J]. 时珍国医国药 2015(06)
    • [17].基于贝叶斯网络的装甲目标战术企图推理模型构建[J]. 火力与指挥控制 2015(07)
    • [18].贝叶斯网络的构建过程[J]. 智富时代 2018(07)
    • [19].贝叶斯身世之谜——写在贝叶斯定理发表250周年之际[J]. 统计研究 2013(12)
    • [20].贝叶斯网络在中医药理论研究的现状及与超分子化学联合应用前景[J]. 湖南中医药大学学报 2019(11)
    • [21].基于贝叶斯优化的心脏病诊断模型[J]. 吕梁学院学报 2020(02)
    • [22].基于贝叶斯网络的大学学情分析研究[J]. 学校党建与思想教育 2020(09)
    • [23].基于贝叶斯粒子群算法的控制权重矩阵优化[J]. 机械制造与自动化 2020(03)
    • [24].基于树形贝叶斯网络的配电网快速灾情推断[J]. 电网技术 2020(06)
    • [25].基于自助法的高斯贝叶斯网结构学习[J]. 长春工业大学学报 2020(04)
    • [26].基于分布式贝叶斯网络的多故障诊断方法研究[J]. 现代电子技术 2017(01)
    • [27].一种基于贝叶斯网络的桥式起重机故障诊断方法[J]. 起重运输机械 2017(04)
    • [28].基于贝叶斯网络的海洋工程装备故障诊断模型[J]. 科技与企业 2016(06)
    • [29].基于云参数贝叶斯网络的威胁评估方法[J]. 计算机技术与发展 2016(06)
    • [30].基于分治策略的贝叶斯网学习方法及在图像分割中的应用[J]. 网络空间安全 2016(05)

    标签:;  ;  ;  ;  ;  

    基于动态贝叶斯网络的连续语音识别研究
    下载Doc文档

    猜你喜欢