语音识别特征提取算法的研究及实现

语音识别特征提取算法的研究及实现

论文摘要

语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本文完成的工作有:1、着重研究了目前使用广泛的美尔频率倒谱系数(MFCC)参数,以24维MFCC参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶MFCC参数,在识别率变化不大的情况下对24维MFCC参数进行了优化组合。2、使用VC++根据动态时间规整(DTW)模型实现了一个连接数字串语音识别系统,并进行了实验分析。系统的组成模块和语音识别系统的基本构成模型一致。在实现时选用了美尔频率系数(MFCC)。3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。4、最后本文研究了汉语连续语音识别中的声学建模方法,给出了识别汉语易混淆词的方法。本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 语音识别技术及其应用
  • 1.2 国内外语音识别技术的发展历史及其现状
  • 1.2.1 国内外语音识别技术的发展历程
  • 1.2.2 语音识别技术发展现状
  • 1.2.3 语音识别面临的主要问题
  • 1.3 本课题研究的背景及内容
  • 1.4 本文的内容结构
  • 第二章 语音识别的基础
  • 2.1 语音信号的预处理
  • 2.1.1 语音信号的采样和量化
  • 2.1.2 语音信号的预加重
  • 2.1.3 语音信号的加窗处理
  • 2.1.4 语音信号的端点检测
  • 2.2 语音信号特征参数的提取
  • 2.2.1 语音信号的时域特征参数
  • 2.2.2 语音信号的频域特征参数
  • 2.3 本章小结
  • 第三章 语音识别的模型及其训练方法
  • 3.1 动态时间规整算法(DTW)
  • 3.1.1 改进的动态时间规整算法
  • 3.2 隐马尔可夫模型
  • 3.2.1 HMM的种类
  • 3.2.2 HMM模型三参数
  • 3.2.3 HMM模型三问题
  • 3.2.4 HMM模型三算法
  • 3.3 人工神经网络
  • 3.4 语音识别训练方法
  • 3.4.1 偶然训练法
  • 3.4.2 鲁棒性训练法
  • 3.4.3 聚类训练法
  • 3.5 本章小结
  • 第四章 特征提取方法的研究及实现
  • 4.1 特征参数实验
  • 4.1.1 实验语音库的构成
  • 4.1.2 MFCC各参数实验
  • 4.1.3 结论
  • 4.2 系统的实现及实验结果
  • 4.2.1 系统预处理实现原理
  • 4.2.1.1 语音信号预处理的实现
  • 4.2.1.2 语音信号特性提取算法的实现
  • 4.2.1.3 端点检测算法的实现
  • 4.2.2 语音信号模板匹配算法的实现
  • 4.2.3 语音信号模板训练算法的实现
  • 4.2.4 语音识别的后处理
  • 4.2.5 系统部分实验结果
  • 4.2.6 系统总结
  • 4.3 采用DSP实现的实时语音识别系统
  • 4.4 本章小结
  • 第五章 语音识别系统的改进
  • 5.1 改进的鲁棒性训练法
  • 5.2 系统参考模板的改进
  • 5.3 系统改进实验结果
  • 5.4 汉语连续语音识别中的声学模型
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 论文的总结
  • 6.2 展望
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    语音识别特征提取算法的研究及实现
    下载Doc文档

    猜你喜欢