论文摘要
语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本文完成的工作有:1、着重研究了目前使用广泛的美尔频率倒谱系数(MFCC)参数,以24维MFCC参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶MFCC参数,在识别率变化不大的情况下对24维MFCC参数进行了优化组合。2、使用VC++根据动态时间规整(DTW)模型实现了一个连接数字串语音识别系统,并进行了实验分析。系统的组成模块和语音识别系统的基本构成模型一致。在实现时选用了美尔频率系数(MFCC)。3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。4、最后本文研究了汉语连续语音识别中的声学建模方法,给出了识别汉语易混淆词的方法。本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。
论文目录
摘要ABSTRACT第一章 绪论1.1 语音识别技术及其应用1.2 国内外语音识别技术的发展历史及其现状1.2.1 国内外语音识别技术的发展历程1.2.2 语音识别技术发展现状1.2.3 语音识别面临的主要问题1.3 本课题研究的背景及内容1.4 本文的内容结构第二章 语音识别的基础2.1 语音信号的预处理2.1.1 语音信号的采样和量化2.1.2 语音信号的预加重2.1.3 语音信号的加窗处理2.1.4 语音信号的端点检测2.2 语音信号特征参数的提取2.2.1 语音信号的时域特征参数2.2.2 语音信号的频域特征参数2.3 本章小结第三章 语音识别的模型及其训练方法3.1 动态时间规整算法(DTW)3.1.1 改进的动态时间规整算法3.2 隐马尔可夫模型3.2.1 HMM的种类3.2.2 HMM模型三参数3.2.3 HMM模型三问题3.2.4 HMM模型三算法3.3 人工神经网络3.4 语音识别训练方法3.4.1 偶然训练法3.4.2 鲁棒性训练法3.4.3 聚类训练法3.5 本章小结第四章 特征提取方法的研究及实现4.1 特征参数实验4.1.1 实验语音库的构成4.1.2 MFCC各参数实验4.1.3 结论4.2 系统的实现及实验结果4.2.1 系统预处理实现原理4.2.1.1 语音信号预处理的实现4.2.1.2 语音信号特性提取算法的实现4.2.1.3 端点检测算法的实现4.2.2 语音信号模板匹配算法的实现4.2.3 语音信号模板训练算法的实现4.2.4 语音识别的后处理4.2.5 系统部分实验结果4.2.6 系统总结4.3 采用DSP实现的实时语音识别系统4.4 本章小结第五章 语音识别系统的改进5.1 改进的鲁棒性训练法5.2 系统参考模板的改进5.3 系统改进实验结果5.4 汉语连续语音识别中的声学模型5.5 本章小结第六章 总结与展望6.1 论文的总结6.2 展望参考文献攻读硕士学位期间发表的论文致谢
相关论文文献
标签:语音识别论文; 端点检测论文; 美尔频率倒谱系数论文; 动态时间规整论文;