论文摘要
面向互动式游戏引擎的语音识别系统,主要的功能就是要使计算机能够自动识别人的语音,从而来驱动游戏中的模型做出相应动作。可以将这种功能划分为两大研究部分:语音识别和3D模型的渲染。而这两部分中更为核心的技术就是语音识别技术,这部分采用的算法的性能直接影响到人机交互的结果,所以针对游戏引擎的特点对语音识别技术进行研究是十分必要的。语音识别主要由端点检测、特征提取、模式匹配等几个部分组成。端点检测就是要准确的检测出语音信号的起始点,将语音信号与噪声信号区分开。特征提取即寻找能够有效表示语音特征的参数;模式匹配即计算一段语音与特征模板之间的相似度。本文提出一种基于基音频率的实时性端点检测算法,通过对实验结果的分析显示算法具有很好的鲁棒性和实时性,同时也提出一种基于C0复杂度理论的改进的非线性算法,通过引入短时能量对传统的C0复杂度算法进行改进,改进后的算法更具鲁棒性,在低信噪比下可以表现出较好的效果,这两种端点检测算法完全满足互动式游戏引擎实时性的特点。通过引入加权滤波分析技术,文中还提出了一种新的语音特征参数:二次加权美尔系数,同时也研究了在求取逆美尔倒谱系数时的加权因子以及最优加权因子。实验结果表明,该参数具有更好的鲁棒性。此外,针对模式匹配常用的两种算法,DTW和HMM,深入分析了算法的原理,并对算法进行实验,同时对实验结果的分析得出适合游戏特点的匹配算法并成功应用到识别系统中。
论文目录
摘要Abstract1 绪论1.1 论文研究背景1.2 国内外研究现状1.3 本文的主要工作1.4 本文的组织2 语音识别原理2.1 语音识别概述2.1.1 语音识别的分类2.1.2 语音识别系统的构成2.1.3 语音识别的应用2.2 语音信号的预处理2.2.1 语音信号的模型及基本特征2.2.2 信号采样2.2.3 预加重处理2.2.4 加窗与分帧2.2.5 语音增强技术2.3 语音信号的特征参数2.3.1 美尔倒谱系数2.3.2 线性预测倒谱系数3 端点检测算法研究与实现3.1 端点检测算法的分类3.1.1 基于能量过零率的端点检测算法3.1.2 基于谱熵的端点检测算法3.1.3 基于频带方差的端点检测算法3.2 基于基频能量的检测算法3.2.1 人的声音特性3.2.2 基频能量算法原理3.2.3 实验结果及分析0复杂度理论的改进算法'>3.3 基于C0复杂度理论的改进算法3.3.1 测度复杂度理论0复杂度理论改进算法原理'>3.3.2 C0复杂度理论改进算法原理3.3.3 实验及结果分析4 特征参数及提取算法研究与实现4.1 二次加权Mel倒谱系数的提取算法4.1.1 Mel频率倒谱系数4.1.2 逆Mel频率倒谱系数4.1.3 二次加权Mel倒谱系数4.2 实验结果及分析5 模式匹配算法的分析与比较5.1 动态规正算法5.1.1 动态规正算法原理5.1.2 动态规正算法实现5.2 隐马尔科夫模型5.2.1 马尔科夫链5.2.2 HMM基本概念及定义5.2.3 HMM算法中模型观察序列概率的计算5.2.4 HMM算法中转移路径的计算5.3 两种算法实验结果的分析与比较6 在互动式游戏引擎平台中的应用6.1 互动式游戏引擎技术平台简介6.2 基于人体姿态的人机交互6.3 基于语音识别的人机交互6.3.1 端点检测6.3.2 特征参数提取6.3.3 模式匹配6.4 系统架构与运行效果6.4.1 系统的模块构成6.4.2 系统运行的效果图结论参考文献攻读硕士学位期间发表学术论文情况致谢
相关论文文献
标签:互动式游戏引擎论文; 语音识别论文; 端点检测论文; 特征参数提取论文; 模式匹配论文;