基于HMM模型的汉语数字语音识别算法的研究

基于HMM模型的汉语数字语音识别算法的研究

论文摘要

语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究领域之一,它与语音学、语言学、数理统计学和神经生理学等学科有非常密切的关系。汉语数字语音识别(mandarin digit speech recognition)的任务是识别“0”到“9”等10个非特定人汉语数字语音。本文着眼于汉语语音识别的主要问题,研究汉语语音识别的关键技术,以提高语音的识别率和识别模型的收敛速度。本文首先对现有的语音识别技术的发展现状进行了分析。在此基础上,介绍了语音识别的基本理论,包括语音信号产生的数学模型和汉语语音特征分析。在语音信号的端点检测方面提出了基于能量和过零率的改进检测方法,并进行了实验仿真和分析。其次详细阐述了线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,结合实验对这两种参数下的识别率进行了比较。实验证明基于MFCC的特征参数比LPCC参数具有更好的识别率。随后介绍了汉语语音识别中常用的方法,动态时间规整(DTW)理论和隐马尔可夫模型(HMM)原理。在对DTW传统方法的分析基础上,本文提出了DTW的高效算法,此高效算法可以减少计算量和存储空间。详细分析了HMM算法的三个基本问题,对实际中Viterbi算法和Baum-Welch算法中存在的下溢问题,分别采用了取对数和定标的方法加以解决。最后利用MATLAB编程实现了基于HMM的汉语数字语音识别系统,比较了HMM用于孤立词和连接词系统的识别率,并与基于DTW的孤立词识别结果作了分析和比较,分别指出了二者的优点和不足,提出了本课题研究未来改进的方向。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 语音识别概述
  • 1.2 语音识别技术的发展
  • 1.3 语音识别现状及难点
  • 1.4 本文的主要工作
  • 第二章 语音信号处理的基本理论
  • 2.1 语音信号产生的数学模型
  • 2.2 语音信号的特征分析
  • 2.2.1 预滤波、采样、A/D转换
  • 2.2.2 预加重
  • 2.2.3 分帧加窗
  • 2.3 端点检测
  • 2.3.1 短时能量
  • 2.3.2 短时平均过零率
  • 2.3.3 基于能量-过零率的改进端点检测算法
  • 2.4 语音特征提取
  • 2.4.1 线性预测系数(LPC)
  • 2.4.2 线性预测倒谱系数(LPCC)
  • 2.4.3 Mel频率倒谱系数
  • 2.4.4 特征参数的失真测度
  • 第三章 基于DTW的汉语识别原理
  • 3.1 DTW的基本原理和算法
  • 3.2 DTW的高效算法
  • 3.3 模板的训练方法
  • 3.4 DTW存在的问题
  • 第四章 隐马尔可夫模型
  • 4.1 隐马尔可夫模型(HMM)
  • 4.1.1 马尔可夫(Markov)链
  • 4.1.2 HMM的基本思想
  • 4.1.3 HMM的基本概念
  • 4.2 HMM模型的三个基本问题
  • 4.2.1 观察序列概率的计算
  • 4.2.2 最佳状态链的确定
  • 4.2.3 参数优化
  • 4.3 HMM的初值选择
  • 4.4 HMM的类型
  • 4.4.1 按照HMM的状态转移概率矩阵(A参数)分类
  • 4.4.2 按照HMM的输出概率分布(B参数)分类
  • 4.5 连接词识别算法
  • 4.5.1 两级DP算法
  • 第五章 基于HMM的汉语数字语音识别
  • 5.1 实验过程设计
  • 5.2 实验结果及讨论
  • 5.2.1 识别仿真结果
  • 5.2.2 HMM的不足
  • 5.2.3 基于DTW的数字语音识别实验结果分析
  • 5.2.4 基于HMM和DTW条件下的识别结果比较
  • 第六章 结论与展望
  • 6.1 本文总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].基于HMM的缝洞型油藏产量预测算法[J]. 西南大学学报(自然科学版) 2020(02)
    • [2].基于HMM模型的藏语词性标注研究[J]. 信息通信 2020(05)
    • [3].基于HMM的矿井提升机故障诊断方法[J]. 煤炭技术 2017(02)
    • [4].基于HMM的连续语音识别系统的构建与研究[J]. 长春大学学报 2015(02)
    • [5].HMM再次实现季度盈利[J]. 中国航务周刊 2020(48)
    • [6].基于二阶HMM的中医诊断古文词性标注[J]. 计算机工程 2017(07)
    • [7].基于HMM模型的藏语语音合成研究[J]. 计算机应用与软件 2015(05)
    • [8].浅谈HMM在词性标注中的应用[J]. 电脑开发与应用 2011(03)
    • [9].基于HMM中文词性标注研究[J]. 金陵科技学院学报 2017(01)
    • [10].基于HMM的机载设备状态健康评估方法研究[J]. 计算机测量与控制 2015(02)
    • [11].基于HMM的柯尔克孜语词性标注的研究[J]. 计算机工程与应用 2014(15)
    • [12].改进的HMM应用于哈萨克语词性标注[J]. 计算机工程与应用 2010(36)
    • [13].复杂网络攻击的HMM检测模型[J]. 计算机工程 2009(12)
    • [14].基于隐马尔可夫模型(HMM)的系统调用异常检测[J]. 太原科技大学学报 2008(01)
    • [15].HMM模型在检测复杂网络攻击中的应用[J]. 计算机工程与应用 2008(07)
    • [16].基于HMM的维吾尔语词性标注研究[J]. 现代计算机(专业版) 2017(07)
    • [17].HMM词性标注中高频生词的处理[J]. 计算机应用与软件 2014(02)
    • [18].基于HMM的主题垂直搜索引擎技术研究[J]. 自动化技术与应用 2014(10)
    • [19].基于多观察序列的HMM训练算法[J]. 湖北工程学院学报 2013(03)
    • [20].语音分离与HMM相结合的语音增强方法[J]. 计算机工程与应用 2013(16)
    • [21].基于HMM的哈萨克语词性标注研究[J]. 计算机应用与软件 2012(02)
    • [22].应用HMM识别在线协作交互模式[J]. 现代教育技术 2008(07)
    • [23].基于HMM的交通事件检测探讨[J]. 现代商贸工业 2008(13)
    • [24].基于HMM的基因剪接供体位点识别改进研究[J]. 科技创新导报 2008(18)
    • [25].基于节点生长马氏距离K均值和HMM的网络入侵检测方法设计[J]. 计算机测量与控制 2014(10)
    • [26].基于HMM的交叉口交通事件预测研究[J]. 交通运输系统工程与信息 2013(06)
    • [27].基于HMM的手势识别研究[J]. 华中师范大学学报(自然科学版) 2012(05)
    • [28].使用HMM模型改进规则自动生成的命名实体识别系统性能[J]. 中小企业管理与科技(下旬刊) 2010(01)
    • [29].隐马尔可夫模型(HMM)及其应用[J]. 湖南科技学院学报 2009(04)
    • [30].HMM模型在语音识别研究中的应用[J]. 电脑知识与技术 2008(34)

    标签:;  ;  ;  ;  ;  

    基于HMM模型的汉语数字语音识别算法的研究
    下载Doc文档

    猜你喜欢