论文摘要
目前在安静的环境下,大多数语音识别系统的识别性能都非常出色,但是在有噪声的环境下,系统性能会有较大的下降。这个问题已成为语音识别系统实用化的一个主要障碍。因此,抗噪语音识别的研究逐渐成为语音识别领域的研究热点。在语音识别系统中,语音特征参数的提取是特别重要的步骤之一。不同的特征参数由于识别性能和抗噪性能的差异,直接影响着系统的噪声鲁棒性。本文首先简单介绍了常用的语音特征参数,分析了目前语音识别中广泛使用的特征参数——Mel频率倒谱系数(MFCC)的提取过程并进行了仿真实验。然后阐述了Charles A.Micchelli和Yuesheng Xu建立的不变集多小波理论,以此为基础讨论了有着自仿映射区间特性的双正交多小波滤波器的推导,及其滤波器的使用方法,根据双正交多小波滤波器的一般推导方法,构建出了基于三角域的多小波滤波器,并用实例证明了不变集多小波分解后能精确重构、无边界失真效应。考虑到多小波比单小波具有更大的自由度可同时具有许多良好的性质,如对称性、短支撑性、正交性和高阶消失矩等;针对短时傅立叶变换在提取语音特征参数时的缺陷,本文在研究不变集多小波理论的基础上,借鉴MFCC参数的提取算法,用多小波变换代替傅立叶变换及MEL滤波,构造了一种新的语音特征参数MWBC,并进行了仿真实验。论文最后介绍了语音识别基本原理和隐马尔可夫模型(HMM)的基本知识,对HMM在汉语数字识别中的一些具体问题进行深入研究,如HMM类型、结构的选择,状态数、混合度的选取等。在安静的环境以及加性高斯随机噪声环境下进行的汉语数字识别实验结果表明,本文提出的新特征参数MWBC的识别性能和抗噪性能均优于MFCC的,为提高语音识别系统的噪声鲁棒性提供了一条新途径。
论文目录
中文摘要英文摘要第1章 绪论1.1 语音识别概述1.1.1 语音识别的发展和现状1.1.2 语音识别所面临的问题1.2 本课题的研究背景和意义1.3 本论文的内容安排第2章 常用的语音识别特征参数的提取2.1 语音信号特征参数简介2.2 语音信号特征提取的预处理和后处理2.2.1 端点检测2.2.2 预加重2.2.3 分帧2.2.4 加窗2.2.5 倒谱提升2.3 语音信号的倒谱分析和MEL 频率倒谱系数(MFCC)2.3.1 语音信号的倒谱分析2.3.2 MEL 频率倒谱系数(MFCC)2.4 MFCC 参数仿真实验2.5 本章小结第3章 不变集多小波理论3.1 多小波的理论背景3.1.1 傅立叶变换3.1.2 短时傅立叶变换3.1.3 小波变换3.1.4 多小波的发展3.2 不变集多小波的构造3.2.1 正交等距映射3.2.2 加细向量场3.2.3 双正交基的递归构造3.2.4 构建初始小波空间3.2.5 重构与分解算法3.3 不变集多小波滤波器的推导和应用3.3.1 不变集多小波滤波器的推导3.3.2 不变集多小波滤波器的应用3.4 本章小结第4章 基于不变集多小波的语音信号特征参数提取4.1 基于不变集多小波的语音信号特征参数的提出4.1.1 常用语音特征参数存在的问题4.1.2 基于不变集多小波的语音特征参数的提出4.2 基于不变集多小波的语音信号特征参数的提取4.3 与MWBC 提取相关的一些解释4.3.1 MWBC 提取时帧长帧移的解释4.3.2 MWBC 提取时多小波分解结构的解释4.4 MWBC 参数仿真实验4.5 本章小结第5章 基于HMM的汉语数字语音识别5.1 语音识别的基本原理5.2 隐马尔可夫模型(HMM)5.2.1 HMM 的引入5.2.2 HMM 的三个基本问题5.2.3 HMM 的基本算法5.3 基于HMM 的汉语数字语音识别5.3.1 实验数据来源及说明5.3.2 HMM 类型和结构的选择5.3.3 HMM 状态数和混合度的选择5.3.4 实验结果及分析5.4 本章小结第6章 总结与展望参考文献攻读硕士学位期间发表的论文致谢
相关论文文献
标签:语音识别论文; 特征参数提取论文; 频率倒谱系数论文; 不变集多小波论文; 隐马尔可夫模型论文;