基于视听信息融合的语音识别研究

基于视听信息融合的语音识别研究

论文摘要

近年来,基于多模态信息的语音识别系统逐渐成为研究热点。单纯依赖单模的声音信息的语音识别在无噪音环境的条件下性能较好,然而,当存在噪声或频率干扰时,其识别性能将大大降低。多模态信息可以提高对语音的感知和理解,应用视觉信息可以有效对抗环境中噪音的干扰。为了提高噪音环境中语音识别的准确性和鲁棒性,本文提出了基于语音与视觉信息融合语音识别方法。本文是在概述语音识别相关学术文献与动态的基础上,以噪声环境下自动语音识别研究为背景,建立了视听信息决策融合模型。首先,本文详述了信息融合的基本原理,分析并比较了多源信息融合的三种层次结构及主要的信息融合方法,研究了隐马尔可夫模型(HMM)在语音识别中的基本算法及语音识别的系统结构。然后,通过分析比较视听信息融合技术在特征层融合和决策层融合方法上的优缺点,提出了基于隐马尔可夫统计模型基础上的视听信息决策融合模型,此模型主体构造由两个HMM分别处理视听信息中观察值序列,同时该模型在音频模式或视频模式下也能进行识别,使它们之间具有保持内在的依赖关系。另外,本文通过采用一种加权融合策略,解决噪声导致HMM的训练与测试不匹配问题。最后通过实验验证表明视听信息决策融合模型比建立在该模型基础上的纯音频自动语音识别以及纯视频自动语音识别的性能更优,并且通过与现有的抗噪声相关方法的对比分析,得出此模型能有效克服噪声,提高识别准确率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究的目的和意义
  • 1.2 国内外的研究现状及分析
  • 1.2.1 国内研究现状
  • 1.2.2 国外研究现状
  • 1.3 本文的主要工作和内容
  • 第2章 多源信息融合算法的研究
  • 2.1 多源信息融合技术
  • 2.2 信息融合基本原理
  • 2.3 信息融合层次结构
  • 2.3.1 数据级融合
  • 2.3.2 特征级融合
  • 2.3.3 决策级融合
  • 2.3.4 三层结构的比较
  • 2.4 信息融合算法
  • 2.4.1 信息融合主要研究方法
  • 2.4.2 信息融合算法研究
  • 2.5 本章小结
  • 第3章 基于HMM 的语音识别方法
  • 3.1 HMM 基本原理
  • 3.1.1 HMM 的定义
  • 3.1.2 HMM 的类型及状态类型的选择
  • 3.1.3 初值选择
  • 3.2 HMM 三种基本算法
  • 3.2.1 前向—后向算法
  • Welch 算法'>3.2.2 BaumWelch 算法
  • 3.2.3 Viterbi 算法
  • 3.2.4 三种算法性能分析
  • 3.3 语音识别系统基本结构
  • 3.3.1 语音识别系统基本结构
  • 3.3.2 语音采集
  • 3.3.3 预处理
  • 3.3.4 特征提取
  • 3.3.5 HMM 训练
  • 3.3.6 HMM 识别
  • 3.4 本章小结
  • 第4章 基于视听信息融合方法的语音识别实验
  • 4.1 视听信息决策融合模型
  • 4.2 视听信息决策融合算法
  • 4.3 视听信息特征提取
  • 4.4 实验结果与分析
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].人工智能下深度学习的语音识别方法分析[J]. 计算机产品与流通 2020(06)
    • [2].基于语音识别的演讲教学系统[J]. 计算机应用 2020(S1)
    • [3].人工智能下深度学习的语音识别方法分析[J]. 电子技术与软件工程 2020(11)
    • [4].语音识别声控小车设计[J]. 中国科技信息 2019(Z1)
    • [5].语音识别大揭秘:计算机如何处理声音?[J]. 中国新通信 2019(04)
    • [6].关于深度学习的语音识别应用研究[J]. 科技经济导刊 2019(12)
    • [7].关于语音识别在空调上的应用与改善[J]. 日用电器 2019(07)
    • [8].语音识别专利技术综述[J]. 河南科技 2019(24)
    • [9].数字语音识别与合成[J]. 电子世界 2019(15)
    • [10].浅谈语音识别[J]. 内蒙古科技与经济 2019(18)
    • [11].基于智能声控需求的语音识别研究[J]. 通讯世界 2019(10)
    • [12].语音识别64年大突破[J]. 机器人产业 2016(06)
    • [13].语音识别为何“叫好不叫座”?[J]. 通信世界 2016(16)
    • [14].语音识别的未来之路[J]. 通信世界 2016(16)
    • [15].动动嘴 让文字自动输入[J]. 电脑爱好者(普及版) 2010(11)
    • [16].带着使命感出发[J]. 英语学习 2017(01)
    • [17].荣威eRX5静态体验 “人性化”语音识别是亮点[J]. 新能源汽车新闻 2017(01)
    • [18].语音识别老祖宗[J]. 经营者(汽车商业评论) 2017(03)
    • [19].智能电视,语音识别或成突破口[J]. 消费指南 2017(05)
    • [20].宝马 用科技打造“未来之家”[J]. 中国汽车市场 2016(11)
    • [21].小学生单词语音识别技能培养研究[J]. 教师博览(科研版) 2017(04)
    • [22].语音识别,或是人工智能下一“风口”[J]. 晚霞 2017(06)
    • [23].端到端语音识别的研究进展与挑战[J]. 中国安防 2020(11)
    • [24].一种低成本语音识别解决方案[J]. 通信技术 2019(12)
    • [25].视频会议系统智能语音识别技术应用研究[J]. 数字技术与应用 2020(05)
    • [26].简述语音识别的实现过程[J]. 科技传播 2019(02)
    • [27].基于深度学习的语音识别方法研究[J]. 智能计算机与应用 2019(02)
    • [28].远场语音识别方法研究[J]. 信息技术与标准化 2018(08)
    • [29].基于深度学习的语音识别方法[J]. 电子技术与软件工程 2019(08)
    • [30].石油石化设备巡检小车语音识别与控制系统设计与实现[J]. 电子设计工程 2017(22)

    标签:;  ;  ;  ;  

    基于视听信息融合的语音识别研究
    下载Doc文档

    猜你喜欢