基于语音结构化模型的连续数字语音识别

基于语音结构化模型的连续数字语音识别

论文摘要

汉语连续数字语音识别在现实中具有非常广泛的应用前景,在电话与电信系统的自动语音拨号、身份证号码证实、智能家电中用于电视频道和空调温度的遥控等多方面都有着重要的应用价值。汉语连续数字语音识别是语音识别中的一个重要分支,其主要难点在于,首先不确定数字串的长度,很难准确判别连续数字串中的字间边界;其次连续数字串中的数字是任意组合的,没有可以借鉴的语法知识;再有汉语数字自身的发音特点导致识别困难,如:数字语音间的混淆程度高,汉语连续数字串中各个数字的协同发音现象较严重等。此外,语音通信中不可避免地会受到说话人差异、线路干扰、环境噪声等的影响,引起信号失真,导致识别系统的鲁棒性相当脆弱。本课题研究主要包括两个方面:(1)采用全局声学结构描述的连续数字语音识别。依据描述语音内在关系的、对传输和处理过程中的线路噪声和说话人变化具有鲁棒性的全局声学结构AUS,提出适合于连续数字语音识别的双层结构化语音模型匹配策略,在没有可以借鉴的语法知识情况下,不需要大量的训练模板,只要使用较少的单个数字语音训练数据就可以实现任意长度的连续数字语音识别,且不需要充分的训练语料和通用的信道归一化技术,解决目前语音识别和连续数字语音识别中存在的说话人差异性等的鲁棒性问题。(2)采用直方图均衡的语音识别鲁棒性研究。在语音识别中,加性噪声也是导致系统性能下降的重要原因。直方图均衡化方法是一种非线性补偿变换技术,较传统的基于线性变换技术的抗噪声方法进一步提高了系统的鲁棒性。但实际识别系统中,除了噪声引起语音特征的非线性失真外,还存在训练和测试数据的语音特征类分布不一致问题,从而难以保证传统的直方图均衡化方法发挥其优势。本文提出一种基于特征分类的直方图均衡化方法,实验结果表明,低信噪比时无论在平稳噪声还是非平稳噪声环境下,与传统的直方图均衡化方法相比都进一步增强了识别系统的鲁棒性。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 语音识别概述
  • 1.2 连续数字语音识别
  • 1.2.1 连续数字语音识别意义及难点
  • 1.2.2 连续数字语音识别研究现状
  • 1.3 本课题的主要研究内容
  • 第二章 语音识别基本理论
  • 2.1 语音识别的基本原理
  • 2.2 语音信号预处理
  • 2.3 特征提取
  • 2.4 隐马尔可夫模型(HMM)
  • 2.4.1 语音的HMM 描述
  • 2.4.2 基于HMM 的语音识别算法
  • 第三章 基于语音结构化模型的连续数字语音识别
  • 3.1 全局声学结构的描述
  • 3.2 语音失真因素
  • 3.3 全局声学结构的不变性
  • 3.4 基于AUS 的连续数字语音识别
  • 3.5 实验与分析
  • 3.5.1 孤立数字语音识别
  • 3.5.2 连续数字语音识别
  • 3.6 小结
  • 第四章 鲁棒性语音识别的HEQ 方法及其改进
  • 4.1 鲁棒性语音识别
  • 4.2 直方图均衡化原理
  • 4.3 直方图均衡化去噪方法
  • 4.3.1 基于自适应分段统计的直方图均衡化方法
  • 4.3.2 基于统计顺序的直方图均衡化方法
  • 4.3.3 其它均衡化方法
  • 4.3.4 传统的直方图均衡化存在的问题
  • 4.4 采用特征分类的直方图均衡化
  • 4.5 噪声环境下实验与分析
  • 4.5.1 实验环境与条件
  • 4.5.2 实验与分析
  • 4.6 小结
  • 第五章 总结与展望
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].人工智能下深度学习的语音识别方法分析[J]. 计算机产品与流通 2020(06)
    • [2].基于语音识别的演讲教学系统[J]. 计算机应用 2020(S1)
    • [3].人工智能下深度学习的语音识别方法分析[J]. 电子技术与软件工程 2020(11)
    • [4].语音识别声控小车设计[J]. 中国科技信息 2019(Z1)
    • [5].语音识别大揭秘:计算机如何处理声音?[J]. 中国新通信 2019(04)
    • [6].关于深度学习的语音识别应用研究[J]. 科技经济导刊 2019(12)
    • [7].关于语音识别在空调上的应用与改善[J]. 日用电器 2019(07)
    • [8].语音识别专利技术综述[J]. 河南科技 2019(24)
    • [9].数字语音识别与合成[J]. 电子世界 2019(15)
    • [10].浅谈语音识别[J]. 内蒙古科技与经济 2019(18)
    • [11].基于智能声控需求的语音识别研究[J]. 通讯世界 2019(10)
    • [12].语音识别64年大突破[J]. 机器人产业 2016(06)
    • [13].语音识别为何“叫好不叫座”?[J]. 通信世界 2016(16)
    • [14].语音识别的未来之路[J]. 通信世界 2016(16)
    • [15].动动嘴 让文字自动输入[J]. 电脑爱好者(普及版) 2010(11)
    • [16].带着使命感出发[J]. 英语学习 2017(01)
    • [17].荣威eRX5静态体验 “人性化”语音识别是亮点[J]. 新能源汽车新闻 2017(01)
    • [18].语音识别老祖宗[J]. 经营者(汽车商业评论) 2017(03)
    • [19].智能电视,语音识别或成突破口[J]. 消费指南 2017(05)
    • [20].宝马 用科技打造“未来之家”[J]. 中国汽车市场 2016(11)
    • [21].小学生单词语音识别技能培养研究[J]. 教师博览(科研版) 2017(04)
    • [22].语音识别,或是人工智能下一“风口”[J]. 晚霞 2017(06)
    • [23].端到端语音识别的研究进展与挑战[J]. 中国安防 2020(11)
    • [24].一种低成本语音识别解决方案[J]. 通信技术 2019(12)
    • [25].视频会议系统智能语音识别技术应用研究[J]. 数字技术与应用 2020(05)
    • [26].简述语音识别的实现过程[J]. 科技传播 2019(02)
    • [27].基于深度学习的语音识别方法研究[J]. 智能计算机与应用 2019(02)
    • [28].远场语音识别方法研究[J]. 信息技术与标准化 2018(08)
    • [29].基于深度学习的语音识别方法[J]. 电子技术与软件工程 2019(08)
    • [30].石油石化设备巡检小车语音识别与控制系统设计与实现[J]. 电子设计工程 2017(22)

    标签:;  ;  ;  ;  

    基于语音结构化模型的连续数字语音识别
    下载Doc文档

    猜你喜欢