论文摘要
随着计算机和语音识别技术的发展,使《汉语普通话水平测试系统》的实现成为可能。《汉语普通水平测试系统》旨在利用人机交互优势,解决现今普通话人工测试的一些缺点。实验证明,利用计算机进行普通话测试有利于统一测试的不足,推广普通话。主要是在对现有语音识别技术进行研究,尤其是在对汉语语音识别技术研究的基础上完成普通话水平测试系统中双音节词测试的设计与实现,系统涉及到语音信号的采集、预处理、特征提取、模型的训练和匹配以及普通话水平的评价方式等。主要研究工作和取得的成果如下:分析一般语音识别系统的结构及所用到的各种理论技术,讨论语音识别系统中涉及到的基本概念及原理,包括语音识别单元的选取、预处理、特征参数的提取、模式匹配及模型训练等技术。对语音识别中各种特征参数的提取方法进行了系统的研究,特别是对反映语音倒谱特征的LPCC和MFCC的提取方法进行了深入的探讨和分析,并对它们进行了仿真实验。深入地探讨了连续概率密度隐马尔可夫模型(CDHMM)的基本原理和识别算法的理论基础和处理方法,且根据实际需要分析得出本系统所用的数学模型的理论根据和可实现性,并给出了算法的具体实现步骤。分析已有类似系统的评分方式,结合目前普通话测试的评分模式改进得出适合本系统的评价方式。在Microsoft Visual Studio 2008和MATLAB 6.5平台上,利用VC++和Matlab实现了汉语普通话中双音节词水平测试系统,并对其进行了测试。本系统主要解决的是双音节词的测试。通过实验测试证明了此系统能够完成预期功能,并通过比较同一个人的两次测试结果,以及不同人的测试结果来判定系统的效果。
论文目录
摘要Abstract1 绪论1.1 前言1.2 语音识别技术的发展和现状1.3 语音识别的分类及系统概述1.4 语音识别目前存在的问题1.5 论文内容安排2 语音信号预处理与特征参数提取2.1 语音信号产生的数学模型2.2 语音信号预处理2.2.1 语音信号的采样和预加重2.2.2 加窗与分帧处理2.2.3 短时能量与短时平均过零率2.2.4 短时自相关函数2.2.5 语音信号的端点检测2.3 几种常用的特征参数提取方法2.3.1 线性预测系数(LPC)2.3.2 线性预测倒谱系数(LPCC)及其仿真实验2.3.3 美尔频率倒谱系数(MFCC)及其仿真实验2.3.4 MFCC和LPCC性能比较3 连续概率密度隐马尔可夫模型3.1 HMM概述3.1.1 Markov链3.1.2 HMM模型的基本思想3.1.3 HMM定义3.1.4 隐Markov模型的分类3.2 连续混合密度隐马尔可夫模型3.2.1 CDHMM的原理3.2.2 CDHMM的主要算法3.3 算法中存在的基本问题3.3.1 问题的提出3.3.2 修正重估公式3.3.3 计算中的下溢问题3.3.4 Markov链的选择3.4 本系统使用的语音识别算法3.4.1 CDHMM模型参数训练3.4.2 模型识别4 系统总体设计4.1 系统模型4.1.1 系统描述4.1.2 系统基本框架4.2 语音数据库4.3 测试者成绩标准4.4 系统的实现5 系统应用与结果讨论5.1 实验测试5.2 测试结论6 总结与展望6.1 总结6.2 展望参考文献硕士期间发表的论文后记
相关论文文献
标签:语音识别论文; 特征提取论文; 模式匹配论文;