![基于高斯混合模型的说话人确认鲁棒性研究和系统实现](https://www.lw50.cn/thumb/72b39c586fbe53fbba7222df.webp)
论文摘要
目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因而抗噪声的研究是说话人识别系统实用的关键。语音识别领域的语音库大部分都是基于单语种的,而测试阶段的语种和训练阶段的语种的不匹配将导致很大的系统性能下降率。本论文在较为深入的研究了高斯混合模型(GMM)和Mel频率倒谱系数(MFCC)的基础上,针对说话人模型的稳定性、准确性和鲁棒性以及语音识别技术在智能控制领域的应用开展了以下工作:1.传统的模型补偿算法中,用白噪声模拟现实环境噪声来建立高斯混合模型以提高系统噪声下的鲁棒性,本论文研究了一种基于多环境噪声多信噪比建模的方法,实验结果表明:基于多环境噪声多信噪比GMM比用白噪声模拟现实环境噪声建立GMM具有更好的噪声鲁棒性。2.针对训练和测试阶段中的语音数据类型(普通话和四川方言)的不匹配对说话人确认系统性能导致很大的下降率问题,本论文研究了一种普通话和四川方言按比例混合建立普通话和四川方言联合GMM的方法。实验结果表明该方法可以有效地加强测试阶段针对语种变化的鲁棒性,可以有效的减少普通话和四川方言在训练和测试阶段的不匹配造成的性能下降率。3.本论文开发了基于GMM与DTW的语音智能家居控制系统,将语音识别技术的说话人确认与孤立词识别有机结合起来,研制开发了用于实时语音识别的原型系统。经过小样本语音库测试后结果表明,该系统识别率较高、实时性较好,能够基本满足办公室、家居环境下较少用户语音识别的要求。
论文目录
摘要ABSTRACT1 绪论1.1 生物识别技术1.1.1 生物识别技术概述1.1.2 生物识别技术的发展历史及分类1.1.3 生物识别技术的优势及语音识别技术的优势1.2 孤立词识别概述1.2.1 孤立词识别研究的背景和意义1.2.2 孤立词识别发展历史1.2.3 孤立词识别主要方法概述1.3 说话人识别概述1.3.1 说话人识别研究的背景和意义1.3.2 说话人识别发展历史1.3.3 说话人识别分类1.3.4 说话人识别主要方法概述1.3.5 说话人识别的研究难点1.3.6 论文的主要研究内容2 基于GMM 与MFCC 的说话人确认2.1 说话人特征参数概述2.2 Mel频率倒谱系数2.2.1 人的听觉系统和语音的感知2.2.2 Mel 频率简介2.2.3 MFCC 参数提取2.3 基于GMM 的说话人确认研究2.3.1 高斯混合模型概述2.3.2 高斯混合模型的参数估计(训练过程)2.3.3 相似度的计算2.3.4 识别的决策2.4 本章小结3 基于GMM 的噪声下说说话人确认研究3.1 噪声下说话人确认的研究3.1.1 噪声的分类及影响3.1.2 三种典型的去噪处理方法3.2 噪声下说话人确认实验所用语音数据库介绍3.3 噪声环境下基于多环境噪声多信噪比GMM 的说话人确认研究3.4 噪声环境下基于多环境噪声多信噪比GMM 的说话人确认实验结果与分析3.4.1 实验结果3.4.2 实验结果分析3.4.3 实验中需要解决的问题3.5 本章小结4 基于GMM 的普通话和四川方言说说话人确认研究4.1 基于GMM 的普通话和四川方言说说话人确认实验所用语音数据库介绍4.2 按不同比例混合普通话和四川方言的联合高斯混合模型4.3 实验结果及分析4.3.1 单一语种创建模型4.3.2 按比例混合普通话和四川方言建立鲁棒性模型4.3.3 实验结果分析4.4 本章小结5 基于语音识别技术的语音智能控制系统的软件研发5.1 语音智能控制系统概述5.2 系统软件功能设计5.3 系统软件功能设计5.3.1 总体结构5.3.2 说话人确认系统5.3.3 孤立词识别系统5.4 语音智能控制系统软件实现中的相关技术处理5.5 系统功能和界面5.6 系统性能评估5.6.1 影响系统性能的相关因素5.6.2 系统性能测试5.7 本章小结6 结论6.1 工作总结6.2 进一步的工作与展望致谢参考文献附录:作者在攻读硕士学位期间发表的论文目录
相关论文文献
标签:说话人确认论文; 高斯混合模型论文; 独立文本论文; 频率倒谱系数论文;