论文摘要
由于现实环境中存在各种噪声,严重影响了语音的识别率,因此带噪语音识别的研究显得尤为重要。本文从语音信号的非线性理论出发,探讨数学形态学在提高语音识别抗噪性能中的应用。对带噪语音识别中的语音增强、特征参数提取及识别方法等关键问题进行了研究。主要研究内容如下:1.对基于形态滤波的语音增强方法进行了研究。采用不同的形态滤波器和结构元素对带噪语音进行增强,得到不同情况下的输出信噪比,分析了结构元素形状及长度对增强效果的影响。2.将形态滤波和小波变换相结合,形成形态-小波滤波器,对带有不同噪声的语音信号进行滤波。实验结果表明,这种滤波器较好地保持了语音信号形状并使信号得到增强,效果优于形态滤波器。3.基于形态滤波器的幂等性,采用形态预失真方法提取纯净语音的美尔倒谱等参数。对纯净、带噪、去噪及预失真语音特征参数间的距离进行了分析比较,得出了预失真方法的可行性。4.在形态滤波的基础上,对基音周期检测方法进行了研究。根据短时平均幅度差函数(AMDF)与修正自相关函数(MACF)的特点,设计了滤波加权修正自相关函数的基音周期检测方法。该方法利用归一化平均幅度差函数的指数形式对修正自相关函数进行加权,实现了带噪语音的基音周期检测。5.采用预失真特征参数作为训练数据用于隐马尔可夫模型(HMM)识别方法,提高了训练和识别的匹配性,使语音识别率较使用传统方法的识别率有较大提高。6.设计了基于预失真参数的改进径向基函数(RBF)神经网络语音识别方法。对隐层中心的选择、权值的计算及网络结构优化方法进行了研究,分析了不同准则对结构优化的影响,确定了改进方案。通过实验分析比较了RBF神经网络与采用预失真参数的改进方法对带噪语音的识别率。
论文目录
摘要ABSTRACT第一章 绪论§1-1 选题意义§1-2 语音增强技术研究现状1-2-1 语音和噪声的特性1-2-2 语音增强方法§1-3 语音识别技术研究现状§1-4 本文的主要研究工作第二章 基于数学形态学的语音增强§2-1 二值形态学基本变换2-1-1 二值膨胀、腐蚀定义2-1-2 二值开闭运算定义2-1-3 二值形态变换性质§2-2 灰度形态学2-2-1 灰度形态运算定义2-2-2 灰度形态变换性质§2-3 形态滤波器§2-4 形态-小波滤波器2-4-1 小波滤波器2-4-2 形态-小波滤波器§2-5 实验结果及分析2-5-1 形态滤波结果及分析2-5-2 形态-小波滤波结果及分析2-5-3 形态滤波器和形态-小波滤波结果比较§2-6 本章小结第三章 基于数学形态学的特征参数提取§3-1 线性预测系数 LPC§3-2 线性预测倒谱系数 LPCC§3-3 Mel 频率倒谱系数 MFCC§3-4 基音周期改进算法§3-5 实验结果及分析3-5-1 系数特征的提取结果及分析3-5-2 基音周期的提取结果及分析§3-6 本章小结第四章 基于预失真参数的 HMM 语音识别§4-1 HMM 理论4-1-1 HMM 的三个基本问题4-1-2 前向-后向算法4-1-3 Viterbi 算法4-1-4 HMM 参数训练――Baum-Welch 算法4-1-5 下溢问题4-1-6 HMM 多观察序列的训练算法§4-2 基于 HMM 的语音识别4-2-1 语音信号预处理4-2-2 语音识别过程§4-3 实验结果及分析§4-4 本章小结第五章 基于预失真参数的改进 RBF 神经网络语音识别§5-1 人工神经网络概述§5-2 径向基神经网络的基本原理5-2-1 径向基函数网络模型5-2-2 径向基函数神经元模型§5-3 RBF 神经网络的学习方法§5-4 改进的 RBF 神经网络5-4-1改进的RBF神经网络设计流程5-4-2 隐层参数的求取5-4-3 权值的共轭梯度优化算法5-4-4 网络结构的优化5-4-5 利用不同信息准则对节点删除结果§5-5 基于改进 RBF 神经网络的语音识别5-5-1 基于改进 RBF 神经网络的语音识别总体流程5-5-2 语音信号预处理及参数提取5-5-3 基于该改进 RBF 神经网络识别结果及分析5-5-4 改进的RBF神经网络与其它方法的结果比较§5-6 基于形态学预失真的带噪语音识别§5-7 本章小结第六章 结论一、全文总结二、本文主要创新点参考文献致谢攻读博士学位期间所取得的相关科研成果
相关论文文献
标签:数学形态学论文; 预失真论文; 小波变换论文; 语音增强论文; 语音识别论文;