噪声环境下说话人识别技术研究

噪声环境下说话人识别技术研究

论文摘要

现在,语音识别系统的应用越来越广泛,然而它们受到很多外界环境的影响,尤其是噪声的影响,使得识别性能下降。抗噪语音识别问题变得越来越重要。本论文首先介绍了语音识别系统的基础知识,然后仿真实验了以Mel频率倒谱系数和线性预测倒谱系数这两种系数作为特征,并对这两种系数使用矢量量化技术进行处理,然后采用支持向量机(SVM)进行分类识别的语音识别系统。在实验中,比较了这两种特征系数的抗噪性能。本论文也是基于这个语音识别系统进行了抗噪声的研究。目前,抗噪声技术主要有语音增强法、提取抗噪特征法、噪声补偿法和丢特征法。本论文对其中的语音增强法和抗噪端点检测法进行了分析研究。在对语音增强算法分析的基础上,提出了一种新的抗噪语音识别模型,这个模型包括两点:语音增强和抗噪特征提取。语音增强采用的是用形态滤波器对语音进行前端滤波处理;抗噪特征提取是用形态滤波器对语音进行二次滤波,然后结合人耳掩蔽特性进行特征提取。因为语音增强会使增强后的语音和原始语音产生偏离,所以我们也对训练语音在前端处理中采用相同的形态滤波器进行滤波。然后对提出的方法进行了不同信噪比下的仿真,实验表明本论文提出的方法使带噪语音和干净语音在语音时域波形上偏离较小,提高了信噪比。本文在对抗噪端点分析的同时,也提出了相应的改进方法,并进行了实验。实验结果表明改进后的端点检测在低信噪比情况下能够有效的分离出噪音和语音,从而准确的检测出语音的端点。最后,基于本文提出的语音端点检测和语音增强和抗噪特征参数提取相结合的方法,搭建了抗噪语音识别模型。在不同噪声类型和不同低信噪比下进行了仿真实验,并从识别率和误识率两个方面进行了结果分析比较。实验表明本文提出的方法在低信噪比下识别性能有很好的改善,识别率得到了提高。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 语音识别技术发展现状
  • 1.2 语音识别技术面临的难题
  • 1.3 噪声背景下的语音识别及研究意义
  • 1.4 本论文所做的主要工作
  • 1.5 论文章节的安排
  • 第二章 基于支持向量机语音识别系统的分析与研究
  • 2.1 语音识别基本原理
  • 2.2 语音信号预处理
  • 2.2.1 预加重
  • 2.2.2 语音信号分帧加窗
  • 2.2.3 端点检测
  • 2.2.3.1 短时能量和幅度
  • 2.2.3.2 短时过零率
  • 2.2.3.3 端点检测流程
  • 2.3 语音特征参数提取
  • 2.3.1 线性预测编码(LPC)系数
  • 2.3.2 线性预测倒谱系数(LPCC)
  • 2.3.3 MFCC 特征参数提取方法
  • 2.3.4 MFCC 系数与LPCC 系数比较
  • 2.4 基于支持向量机的说话人识别
  • 2.4.1 支持向量机的基本理论
  • 2.4.2 支持向量机的基本方法
  • 2.4.2.1 线性情况
  • 2.4.2.2 非线性情形与核函数
  • 2.4.3 支撑向量机的变形算法
  • 2.4.4 支持向量机在语音识别中的应用
  • 2.4.4.1 矢量量化技术(VQ)基本原理
  • 2.4.4.2 矢量量化的失真测度
  • 2.4.4.3 矢量量化器的最佳码本设计
  • 2.4.4.4 初始码本的生成
  • 2.4.4.5 训练样本集生成
  • 2.4.4.6 基于SVM 的说话人识别
  • 2.4.4.7 实验结果及分析
  • 2.5 小结
  • 第三章 抗噪语音识别研究
  • 3.1 引言
  • 3.2 影响语音识别的环境因素
  • 3.3 抗噪语音识别技术研究现状
  • 3.3.1 基于信号空间的鲁棒技术——语音增强
  • 3.3.2 基于特征空间的鲁棒技术——提取抗噪声语音特征
  • 3.3.3 基于模型空间的鲁棒技术——模型补偿
  • 3.4 语音识别系统性能的主要技术指标
  • 3.5 抗噪语音识别的方法分析研究
  • 3.5.1 基于语音信号前端处理的抗噪技术
  • 3.5.1.1 基于形态滤波器的语音抗噪预处理
  • 3.5.1.2 基于鲁棒语音特征提取
  • 3.5.1.3 语音增强和提取抗噪特征参数相结合的新模型的提出
  • 3.5.1.4 仿真结果分析
  • 3.5.2 噪声下的端点检测方法研究分析
  • 3.5.2.1 时频方差和检测法
  • 3.5.2.2 能量检测和浊音检测相结合
  • 3.6 小结
  • 第四章 抗噪语音识别系统的仿真和分析
  • 4.1 抗噪语音识别系统组成
  • 4.2 仿真结果分析
  • 4.2.1 实验数据
  • 4.2.2 实验效果评估方式
  • 4.2.3 改进前后端点检测比较的仿真实验
  • 4.2.3.1 多项式作为传统支持向量机的核函数
  • 4.2.3.2 高斯径向基作为传统支持向量机的核函数
  • 4.2.3.3 高斯径向基作为最小二乘向量机的核函数
  • 4.2.4 抗噪语音识别模型仿真
  • 4.3 小结
  • 第五章 结论与展望
  • 致谢
  • 参考文献
  • 攻读硕期间取得的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    噪声环境下说话人识别技术研究
    下载Doc文档

    猜你喜欢