数学形态学在语音识别中的应用研究

论文摘要

由于现实环境中存在各种噪声,严重影响了语音的识别率,因此带噪语音识别的研究显得尤为重要。本文从语音信号的非线性理论出发,探讨数学形态学在提高语音识别抗噪性能中的应用。对带噪语音识别中的语音增强、特征参数提取及识别方法等关键问题进行了研究。主要研究内容如下:1.对基于形态滤波的语音增强方法进行了研究。采用不同的形态滤波器和结构元素对带噪语音进行增强,得到不同情况下的输出信噪比,分析了结构元素形状及长度对增强效果的影响。2.将形态滤波和小波变换相结合,形成形态-小波滤波器,对带有不同噪声的语音信号进行滤波。实验结果表明,这种滤波器较好地保持了语音信号形状并使信号得到增强,效果优于形态滤波器。3.基于形态滤波器的幂等性,采用形态预失真方法提取纯净语音的美尔倒谱等参数。对纯净、带噪、去噪及预失真语音特征参数间的距离进行了分析比较,得出了预失真方法的可行性。4.在形态滤波的基础上,对基音周期检测方法进行了研究。根据短时平均幅度差函数（AMDF）与修正自相关函数（MACF）的特点,设计了滤波加权修正自相关函数的基音周期检测方法。该方法利用归一化平均幅度差函数的指数形式对修正自相关函数进行加权,实现了带噪语音的基音周期检测。5.采用预失真特征参数作为训练数据用于隐马尔可夫模型（HMM）识别方法,提高了训练和识别的匹配性,使语音识别率较使用传统方法的识别率有较大提高。6.设计了基于预失真参数的改进径向基函数（RBF）神经网络语音识别方法。对隐层中心的选择、权值的计算及网络结构优化方法进行了研究,分析了不同准则对结构优化的影响,确定了改进方案。通过实验分析比较了RBF神经网络与采用预失真参数的改进方法对带噪语音的识别率。

论文目录

摘要

ABSTRACT

第一章绪论

§1-1 选题意义

§1-2 语音增强技术研究现状

1-2-1 语音和噪声的特性

1-2-2 语音增强方法

§1-3 语音识别技术研究现状

§1-4 本文的主要研究工作

第二章基于数学形态学的语音增强

§2-1 二值形态学基本变换

2-1-1 二值膨胀、腐蚀定义

2-1-2 二值开闭运算定义

2-1-3 二值形态变换性质

§2-2 灰度形态学

2-2-1 灰度形态运算定义

2-2-2 灰度形态变换性质

§2-3 形态滤波器

§2-4 形态-小波滤波器

2-4-1 小波滤波器

2-4-2 形态-小波滤波器

§2-5 实验结果及分析

2-5-1 形态滤波结果及分析

2-5-2 形态-小波滤波结果及分析

2-5-3 形态滤波器和形态-小波滤波结果比较

§2-6 本章小结

第三章基于数学形态学的特征参数提取

§3-1 线性预测系数 LPC

§3-2 线性预测倒谱系数 LPCC

§3-3 Mel 频率倒谱系数 MFCC

§3-4 基音周期改进算法

§3-5 实验结果及分析

3-5-1 系数特征的提取结果及分析

3-5-2 基音周期的提取结果及分析

§3-6 本章小结

第四章基于预失真参数的 HMM 语音识别

§4-1 HMM 理论

4-1-1 HMM 的三个基本问题

4-1-2 前向-后向算法

4-1-3 Viterbi 算法

4-1-4 HMM 参数训练――Baum-Welch 算法

4-1-5 下溢问题

4-1-6 HMM 多观察序列的训练算法

§4-2 基于 HMM 的语音识别

4-2-1 语音信号预处理

4-2-2 语音识别过程

§4-3 实验结果及分析

§4-4 本章小结

第五章基于预失真参数的改进 RBF 神经网络语音识别

§5-1 人工神经网络概述

§5-2 径向基神经网络的基本原理

5-2-1 径向基函数网络模型

5-2-2 径向基函数神经元模型

§5-3 RBF 神经网络的学习方法

§5-4 改进的 RBF 神经网络

5-4-1改进的RBF神经网络设计流程

5-4-2 隐层参数的求取

5-4-3 权值的共轭梯度优化算法

5-4-4 网络结构的优化

5-4-5 利用不同信息准则对节点删除结果

§5-5 基于改进 RBF 神经网络的语音识别

5-5-1 基于改进 RBF 神经网络的语音识别总体流程

5-5-2 语音信号预处理及参数提取

5-5-3 基于该改进 RBF 神经网络识别结果及分析

5-5-4 改进的RBF神经网络与其它方法的结果比较

§5-6 基于形态学预失真的带噪语音识别

§5-7 本章小结

第六章结论

一、全文总结

二、本文主要创新点

参考文献

致谢

攻读博士学位期间所取得的相关科研成果

数学形态学在语音识别中的应用研究

论文摘要

论文目录

相关论文文献

猜你喜欢