论文摘要
本论文主要的研究内容是基于噪音环境下的语音识别性能的改进研究。语音识别是指利用计算机通过识别和理解把人类的语音信号转变为相应的文本或命令技术。然而,大多数语音识别系统都只适合于识别安静环境中的语音,当它们应用于噪音环境中时,性能却大大降低。因此,在噪音环境下进行语音识别是现阶段语音识别发展过程中的一个难点。虽然如此,但它在我们这种高速发展的信息时代却有着可观的实用价值。作者从语音识别的端点检测进行了研究,搭建了包括语音采集、噪音合成、特征提取,直到产生识别结果的在内的语音识别软件系统平台。在该平台的基础上,做了下面的改进研究:(1)提出一种端点检测的新算法:研究表明,即使在安静的环境中,语音识别系统一半以上的识别错误来自端点检测器。因此,作为语音识别系统的第一步,端点检测的重要性是不容忽视的,尤其是噪音环境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。所以,本文给出了一种基于线性预测系数(LPC)距离算法的端点检测方案,可以有效的解决强噪音环境下的端点检测问题。(2)基于新算法的改进:在强噪声情况下,LPC距离算法可以有效抑制噪音,可是它也有自己的不足之处,即不能在高信噪比的条件下进行有效的端点检测,而这恰恰是传统算法的长处,所以作者就考虑将两者结合起来,将两者的参数进行组合,实验证明,这种方法可以较大范围地满足噪音环境下的端点检测要求,进而可以更好地抑制环境噪音。
论文目录
摘要ABSTRACT目录CONTENTS第一章 绪论1.1 语音识别的定义1.2 语音识别的发展简介1.3 语音识别技术的应用1.3.1 语音信息检索1.3.2 发音学习技术1.3.3 基于语音的情感处理1.3.4 网络环境下的语音识别1.3.5 嵌入式语音识别技术1.4 语音识别基本原理1.5 语音识别系统的分类1.5.1 按照词汇表大小分1.5.2 按照发音方式分1.5.3 按照说话人的限定范围分1.5.4 按照识别方法分1.6 语音识别面临的主要的问题1.6.1 语音识别的方言和口音问题1.6.2 信道问题1.6.3 背景噪音问题1.6.4 自然语音理解领域1.6.5 语音合成1.7 本论文要完成的内容第二章 语音信号处理基本原理2.1 语音信号产生的生理机制2.1.1 语音信号产生及特征2.1.2 人耳感知特性和噪音特性2.1.3 语音信号产生的数学模型2.2 语料库2.2.1 语料库的概述2.2.2 语音语料库的建立和收集要点2.3 语音识别单元的选取2.4 语音信号数字化及预处理2.4.1 语音信号预滤波、语音采样、A/D变换2.4.2 语音信号预处理2.5 语音信号分析方法2.5.1 时域处理方法2.5.2 频域处理方法2.5.3 同态处理及倒谱域特征提取方法2.6 小结第三章 语音识别的主要模型3.1 概述3.2 高斯混合模型3.2.1 高斯混合模型的定义3.2.2 高斯混合模型的迭代算法3.3 隐马尔可夫模型(HMM)3.3.1 隐马尔可夫模型的数学描述3.3.2 隐马尔可夫模型的结构类型3.3.3 HMM算法实现的问题3.4 小结第四章 噪音情况下的端点检测4.1 端点检测原理4.2 经典方法的比较4.3 分析与改进设想4.4 基于 LPC距离的综合研究方法4.5 小结第五章 系统仿真5.1 强噪音环境下端点检测平台的建立5.1.1 软件平台5.1.2 语音库5.2 实验结果及分析5.3 展望5.4 小结结论1.总结2.展望参考文献攻读学位期间发表论文和获奖致谢
相关论文文献
标签:语音识别论文; 噪音抑制论文; 端点检测论文; 线性预测系数距离论文;