论文摘要
现在,语音识别系统的应用越来越广泛,然而它们受到很多外界环境的影响,尤其是噪声的影响,使得识别性能下降。抗噪语音识别问题变得越来越重要。本论文首先介绍了语音识别系统的基础知识,然后仿真实验了以Mel频率倒谱系数和线性预测倒谱系数这两种系数作为特征,并对这两种系数使用矢量量化技术进行处理,然后采用支持向量机(SVM)进行分类识别的语音识别系统。在实验中,比较了这两种特征系数的抗噪性能。本论文也是基于这个语音识别系统进行了抗噪声的研究。目前,抗噪声技术主要有语音增强法、提取抗噪特征法、噪声补偿法和丢特征法。本论文对其中的语音增强法和抗噪端点检测法进行了分析研究。在对语音增强算法分析的基础上,提出了一种新的抗噪语音识别模型,这个模型包括两点:语音增强和抗噪特征提取。语音增强采用的是用形态滤波器对语音进行前端滤波处理;抗噪特征提取是用形态滤波器对语音进行二次滤波,然后结合人耳掩蔽特性进行特征提取。因为语音增强会使增强后的语音和原始语音产生偏离,所以我们也对训练语音在前端处理中采用相同的形态滤波器进行滤波。然后对提出的方法进行了不同信噪比下的仿真,实验表明本论文提出的方法使带噪语音和干净语音在语音时域波形上偏离较小,提高了信噪比。本文在对抗噪端点分析的同时,也提出了相应的改进方法,并进行了实验。实验结果表明改进后的端点检测在低信噪比情况下能够有效的分离出噪音和语音,从而准确的检测出语音的端点。最后,基于本文提出的语音端点检测和语音增强和抗噪特征参数提取相结合的方法,搭建了抗噪语音识别模型。在不同噪声类型和不同低信噪比下进行了仿真实验,并从识别率和误识率两个方面进行了结果分析比较。实验表明本文提出的方法在低信噪比下识别性能有很好的改善,识别率得到了提高。
论文目录
摘要Abstract第一章 绪论1.1 语音识别技术发展现状1.2 语音识别技术面临的难题1.3 噪声背景下的语音识别及研究意义1.4 本论文所做的主要工作1.5 论文章节的安排第二章 基于支持向量机语音识别系统的分析与研究2.1 语音识别基本原理2.2 语音信号预处理2.2.1 预加重2.2.2 语音信号分帧加窗2.2.3 端点检测2.2.3.1 短时能量和幅度2.2.3.2 短时过零率2.2.3.3 端点检测流程2.3 语音特征参数提取2.3.1 线性预测编码(LPC)系数2.3.2 线性预测倒谱系数(LPCC)2.3.3 MFCC 特征参数提取方法2.3.4 MFCC 系数与LPCC 系数比较2.4 基于支持向量机的说话人识别2.4.1 支持向量机的基本理论2.4.2 支持向量机的基本方法2.4.2.1 线性情况2.4.2.2 非线性情形与核函数2.4.3 支撑向量机的变形算法2.4.4 支持向量机在语音识别中的应用2.4.4.1 矢量量化技术(VQ)基本原理2.4.4.2 矢量量化的失真测度2.4.4.3 矢量量化器的最佳码本设计2.4.4.4 初始码本的生成2.4.4.5 训练样本集生成2.4.4.6 基于SVM 的说话人识别2.4.4.7 实验结果及分析2.5 小结第三章 抗噪语音识别研究3.1 引言3.2 影响语音识别的环境因素3.3 抗噪语音识别技术研究现状3.3.1 基于信号空间的鲁棒技术——语音增强3.3.2 基于特征空间的鲁棒技术——提取抗噪声语音特征3.3.3 基于模型空间的鲁棒技术——模型补偿3.4 语音识别系统性能的主要技术指标3.5 抗噪语音识别的方法分析研究3.5.1 基于语音信号前端处理的抗噪技术3.5.1.1 基于形态滤波器的语音抗噪预处理3.5.1.2 基于鲁棒语音特征提取3.5.1.3 语音增强和提取抗噪特征参数相结合的新模型的提出3.5.1.4 仿真结果分析3.5.2 噪声下的端点检测方法研究分析3.5.2.1 时频方差和检测法3.5.2.2 能量检测和浊音检测相结合3.6 小结第四章 抗噪语音识别系统的仿真和分析4.1 抗噪语音识别系统组成4.2 仿真结果分析4.2.1 实验数据4.2.2 实验效果评估方式4.2.3 改进前后端点检测比较的仿真实验4.2.3.1 多项式作为传统支持向量机的核函数4.2.3.2 高斯径向基作为传统支持向量机的核函数4.2.3.3 高斯径向基作为最小二乘向量机的核函数4.2.4 抗噪语音识别模型仿真4.3 小结第五章 结论与展望致谢参考文献攻读硕期间取得的研究成果
相关论文文献
标签:抗噪语音识别论文; 语音增强论文; 前端处理论文; 端点检测论文; 支持向量机论文;