非特定人汉语连续数字语音识别系统的研究与实现

非特定人汉语连续数字语音识别系统的研究与实现

论文摘要

本文在对语音识别相关理论研究的基础上,应用VC++编程技术构建了实时语音识别软件系统,并在该软件系统上对汉语非特定人连续数字语音识别进行了一系列实验,取得了较好的效果。本文首先介绍语音识别技术国内外发展状况,分析了汉语连续数字语音识别中面临的困难,在此基础上阐明本课题的研究背景和意义。其次,讨论了语音识别系统的基本原理及构成模型。详细介绍了语音信号分析技术以及隐马尔可夫模型(Hidden Markov Model,HMM)等相关理论,为语音识别软件系统的实现和语音识别实验的开展奠定了相关的理论基础。再次,应用VC++软件编程技术构建了实时语音识别软件系统。在软件系统构建过程中充分考虑了软件的适应性和易用性,通过多线程多缓冲技术实现了声卡实时采集与回放,网络实时接收与发送等功能;友好的人机界面可以对语音信号进行实时观察与分析,对识别结果进行直观显示等;在识别处理方面,深入研究并借鉴了英国剑桥大学的语音识别系统HTK的开源代码,保证了识别系统的先进性。最后,在本文编制的软件系统上对汉语非特定人连续数字语音进行了相关的识别实验并对识别结果进行了分析,取得良好的效果。同时对语音识别系统进行了全面的总结,并对今后的工作进行了展望。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 语音识别的基本概念
  • 1.2 语音识别基本原理和方法
  • 1.2.1 语音识别的基本原理
  • 1.2.2 语音识别的基本方法
  • 1.3 语音识别发展历史及现状
  • 1.3.1 国外研究历史及现状
  • 1.3.2 国内研究历史及现状
  • 1.4 论文研究的目的和意义
  • 1.4.1 汉语数字语音识别所面临的问题
  • 1.4.2 汉语连续数字语音识别的研究意义
  • 1.5 论文研究内容
  • 第二章 语音信号分析
  • 2.1 概述
  • 2.2 语音信号预处理
  • 2.2.1 语音信号预加重处理
  • 2.2.2 语音信号分帧与加窗处理
  • 2.3 语音信号端点检测
  • 2.3.1 端点检测的目的
  • 2.3.2 端点检测的参量选择
  • 2.3.3 端点检测的原理
  • 2.3.4 噪音统计及端点检测指标量的计算
  • 2.4 特征参数的提取
  • 2.4.1 线性预测分析及 LPCC 参数提取过程
  • 2.4.2 MFCC 参数及提取过程
  • Delta 特征参数的提取'>2.4.3 Delta 与 DeltaDelta 特征参数的提取
  • 2.4.4 MFCC 参数与 LPCC 参数的对比
  • 2.5 本章小结
  • 第三章 隐马尔可夫模型及其在语音识别中的应用
  • 3.1 概述
  • 3.2 隐马尔科夫模型的定义
  • 3.2.1 马尔科夫链
  • 3.2.2 隐马尔科夫模型
  • 3.3 隐马尔科夫模型的三个基本问题
  • 3.3.1 隐马尔科夫模型的评价问题—前后向算法
  • 3.3.2 隐马尔科夫模型的解码问题—Viterbi 算法
  • 3.3.3 隐马尔科夫模型的学习问题—Baum-Welch 算法
  • 3.4 隐马尔科夫模型的结构和类型
  • 3.5 隐马尔科夫模型在语音识别中的应用
  • 3.5.1 汉语声学模型的选取
  • 3.5.2 隐马尔科夫模型的建立
  • 3.5.3 隐马尔科夫模型的训练
  • 3.5.4 隐马尔科夫模型的识别
  • 3.6 隐马尔科夫模型存在的问题
  • 3.7 本章小结
  • 第四章 基于 VC++的语音识别软件系统的构建
  • 4.1 概述
  • 4.2 语音识别软件系统的接口实现
  • 4.2.1 语音识别软件系统文件回放技术的实现
  • 4.2.2 语音识别软件系统声卡实时采集技术的实现
  • 4.2.3 语音识别软件系统网络通信技术的实现
  • 4.3 语音识别软件系统信号处理流程
  • 4.4 语音识别软件系统人机交互与信号分析的实现
  • 4.5 语音识别软件系统模型训练与评估的实现
  • 4.6 语音识别软件实时运行的实现
  • 4.7 本章小结
  • 第五章 语音识别实验及结果分析
  • 5.1 概述
  • 5.2 实验准备
  • 5.2.1 实验软硬件环境
  • 5.2.2 实验语音库的建立
  • 5.2.3 声学模型与结构的选择
  • 5.2.4 信号特征参数的选择
  • 5.2.5 系统识别词典、语法模型的建立以及识别性能评估算法
  • 5.3 实验及结果分析
  • 5.3.1 不同状态数的识别实验
  • 5.3.2 不同高斯密度混合数的识别实验
  • 5.3.3 不同声学单元的识别实验
  • 5.3.4 不同模型状态转移数的识别实验
  • 5.3.5 不同特征参数的识别实验
  • 5.4 连续数字语音实时识别系统的实现
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 论文总结
  • 6.2. 未来工作展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].广电智能语音识别系统建设实施方案[J]. 中国有线电视 2020(03)
    • [2].面向语音识别系统的黑盒对抗攻击方法[J]. 小型微型计算机系统 2020(05)
    • [3].压电陶瓷的声带振动语音识别系统[J]. 单片机与嵌入式系统应用 2020(07)
    • [4].分区域方言客服语音识别系统研究[J]. 网络新媒体技术 2019(01)
    • [5].早晚期混响划分对理想比值掩蔽在语音识别性能上的影响[J]. 声学学报 2019(04)
    • [6].嵌入式实时英语语音识别系统的设计与研究[J]. 电子设计工程 2017(08)
    • [7].基于嵌入式的语音识别系统设计与实现[J]. 长春师范大学学报 2017(10)
    • [8].浅析小型语音识别系统的研究和开发[J]. 信息化建设 2015(10)
    • [9].法苑传真[J]. 江淮法治 2016(22)
    • [10].语音识别系统[J]. 少先队活动 2014(05)
    • [11].英语翻译器语音识别系统的设计及功能实现[J]. 微型电脑应用 2018(12)
    • [12].嵌入式语音识别系统的测试方法研究[J]. 计算机技术与发展 2019(07)
    • [13].基于人工智能深度学习的语音识别方法[J]. 信息记录材料 2017(09)
    • [14].一种用于无线通信的数字语音识别系统设计[J]. 现代电子技术 2016(16)
    • [15].英语翻译器语音识别系统设计及其应用[J]. 电子测试 2015(04)
    • [16].简单语音识别系统的设计实现[J]. 中国新通信 2013(16)
    • [17].语音识别系统的硬件设计[J]. 硅谷 2012(02)
    • [18].基于改进谱减法的语音识别系统去噪[J]. 大众科技 2012(12)
    • [19].神田公司采用语音识别系统提高发货效率[J]. 物流技术与应用 2009(06)
    • [20].一种基于隐马尔科夫模型的跑步机语音识别系统设计[J]. 信息技术与信息化 2020(09)
    • [21].智能语音识别系统噪声鲁棒性研究[J]. 信息技术与标准化 2019(06)
    • [22].基于香橙派的智能语音识别系统的设计[J]. 电子测量技术 2019(19)
    • [23].重庆方言语音识别系统的设计与实现[J]. 计算机测量与控制 2018(01)
    • [24].一种语音识别的可定制云计算方法[J]. 中国海洋大学学报(自然科学版) 2014(01)
    • [25].嵌入式语音识别系统研究[J]. 电脑与信息技术 2014(01)
    • [26].实时语音识别系统在家庭监护机器人的实现[J]. 电子设计工程 2012(07)
    • [27].基于小波去噪的语音识别系统[J]. 数字技术与应用 2012(05)
    • [28].出行者信息服务系统中后台语音识别系统的研究[J]. 交通标准化 2011(Z1)
    • [29].基于深度学习的移动端语音识别系统设计[J]. 单片机与嵌入式系统应用 2020(09)
    • [30].嵌入式英语语音识别系统误差自动检测方法研究[J]. 自动化与仪器仪表 2019(09)

    标签:;  ;  ;  

    非特定人汉语连续数字语音识别系统的研究与实现
    下载Doc文档

    猜你喜欢