基于混合特征和高斯混合模型的说话人识别研究

基于混合特征和高斯混合模型的说话人识别研究

论文摘要

语音是实现人们之间沟通交流的最直接与方便的手段,而实现计算机与人之间畅通无阻的语音交流,一直是人类不懈追求的梦想。说话人识别是语音信号的一个重要的研究方向,有着重要的理论意义和广泛的应用前景。在本质上讲,说话人识别技术大体上可以分为特征提取和识别模型两部分。因此从某种意义上说,说话人识别研究主要问题的存在都可以归结为是由特征提取部分或者识别模型部分的局限性引起的。大量的研究表明,目前说话人识别的问题主要来自于说话人的特征提取上,如何寻求新的更具有个性特征的表现力、拥有更强的鲁棒性的语音特征,或者对现有特征进行优化的选择、融合、补偿等方法来增强现有系统的性能,仍然是说话人识别技术领域中一个亟待解决的重要问题。本论文对基于Fisher准则构造的混合特征参数和高斯混合模型的说话人识别系统进行了研究,主要做了以下几方面的工作:(1)介绍了说话人识别系统的相关概念、基本原理和一般步骤。(2)在传统的说话人识别系统中,语音片段通过预处理后一般直接进行特征提取,这样做会存在一个缺点:语音片段中通常都存在一些无声段,如果不剔除无声段而直接提取特征,提取的语音特征中就会包含无声段的语音特征,这些特征对说话人识别会有干扰,从而降低了正确识别率。为此本文在语音经过预处理后增加了语音端点检测的过程,然后再提取特征。语音端点检测的目的是剔除语音片段中的无声段,这样既能减少计算量又能排除无声段的干扰,从而提高说话人识别的正确识别率。还详细介绍了端点检测的过程和一些常用特征提取的过程以及它们的MATLAB实现。语音特征提取完后,传统的特征选取是采用常用特征中的一种或者几种特征的简单组合,而这些特征中可能包含一些冗余信息或者对识别性能有干扰的语音信息,这些冗余信息和干扰的语音信息会降低识别性能。为此本文在结合LPCC、MFCC以及它们的Delta特征的基础上利用Fisher准则进行特征选择,选出类别可分离性最好的特征参数同时去除了那些冗余信息或对识别性能有干扰的信息,达到降维和提高识别性能的目的,并给出了它的MATLAB实现。(3)详细介绍了基于高斯混合模型的说话人识别系统的基本概念、EM算法、GMM参数的初始化和基于高斯混合模型的说话人识别系统的判别准则及其MATLAB实现。(4)为了使说话人识别系统的识别性能达到最高,通过实验与分析,首先需要确定说话人识别系统的最佳基本要素,如:LPCC和MFCC特征参数的阶数、GMM模型的阶数、测试语音长度,然后研究利用Fisher准则对单一特征或者各种特征参数进行组合进行特征选择后对识别性能的影响。证明了利用Fisher准则对特征进行选择有利于识别性能的提高,并给出了使识别性能达到最高的特征参数组合。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究的背景和意义
  • 1.2 研究的历史和现状
  • 1.3 论文的内容及章节安排
  • 第二章 说话人识别系统概述
  • 2.1 说话人识别基本介绍
  • 2.2 说话人识别基本原理和系统结构
  • 2.3 特征提取
  • 2.4 说话人识别模型
  • 第三章 特征提取的过程及其MATLAB实现
  • 3.1 语音端点检测
  • 3.2 LPCC的提取及其MATLAB实现
  • 3.3 MFCC的提取及其MATLAB实现
  • 3.4 Delta特征的提取及其MATLAB实现
  • 3.5 根据Fisher准则进行特征选择
  • 第四章 高斯混合模型及其MATLAB实现
  • 4.1 高斯混合模型的基本概念
  • 4.2 EM算法
  • 4.3 GMM参数的初始化
  • 4.4 基于高斯混合模型的说话人识别系统
  • 第五章 说话人识别的实验与分析
  • 5.1 实验条件
  • 5.2 实验结果与分析
  • 第六章 总结与展望
  • 6.1 论文工作总结
  • 6.2 研究的展望
  • 致谢
  • 参考文献
  • 附录A
  • 附录B
  • 相关论文文献

    • [1].噪声环境下基于自适应高斯混合模型的说话人识别[J]. 科技视界 2020(17)
    • [2].邻域约束高斯混合模型的模糊聚类图像分割[J]. 模式识别与人工智能 2017(03)
    • [3].基于注意力机制和离散高斯混合模型的端到端图像压缩方法[J]. 重庆邮电大学学报(自然科学版) 2020(05)
    • [4].基于隐高斯混合模型的人脑MRI分割方法[J]. 计算机工程与应用 2018(10)
    • [5].基于高斯混合模型法的交通监控中运动车辆的自动提取[J]. 辽宁工业大学学报(自然科学版) 2015(03)
    • [6].高斯混合模型的理解和应用[J]. 课程教育研究 2018(48)
    • [7].基于改进高斯混合模型的遥感影像道路提取[J]. 测绘工程 2014(03)
    • [8].基于二维高斯混合模型的驾驶行为分析[J]. 硅谷 2011(05)
    • [9].基于高斯混合模型的图像检索算法研究[J]. 软件导刊 2011(04)
    • [10].自适应类别的层次高斯混合模型遥感影像分割[J]. 电子学报 2020(01)
    • [11].基于高斯混合模型的非平衡数据对称翻转算法[J]. 信息与控制 2020(02)
    • [12].基于高斯混合模型林火“烟雾根”的识别[J]. 林业和草原机械 2020(01)
    • [13].高斯混合模型在星载激光全波形数据反演树高中的应用[J]. 测绘与空间地理信息 2019(05)
    • [14].基于高斯混合模型的最大期望聚类算法研究[J]. 微型电脑应用 2018(05)
    • [15].一种基于高斯混合模型、结合拓扑与内容的大规模社团发现方法[J]. 小型微型计算机系统 2018(06)
    • [16].基于高斯混合模型的人群异常检测[J]. 软件导刊 2017(11)
    • [17].自适应高斯混合模型及说话人识别应用[J]. 通信技术 2014(07)
    • [18].基于高斯混合模型聚类和多维尺度分析的负荷分类方法[J]. 电网技术 2020(11)
    • [19].基于量子高斯混合模型的振动信号降噪方法[J]. 振动与冲击 2019(11)
    • [20].基于卷积高斯混合模型的统计压缩感知[J]. 物理学报 2019(18)
    • [21].一种基于高斯混合模型的海上浮标轨迹聚类算法[J]. 现代计算机(专业版) 2017(36)
    • [22].基于高斯混合模型的工业机器人适应性抓取[J]. 组合机床与自动化加工技术 2018(06)
    • [23].基于高斯混合模型的衍射成像算法[J]. 电子学报 2018(10)
    • [24].基于高斯混合模型的类人机器人果实辨识研究[J]. 安徽农业科学 2014(15)
    • [25].基于高斯混合模型的逆变器故障诊断方法研究[J]. 计算机测量与控制 2020(03)
    • [26].基于高斯混合模型的铝电解槽况聚类研究[J]. 轻金属 2020(02)
    • [27].基于高斯混合模型的叶片检测分割算法[J]. 计算机应用与软件 2018(01)
    • [28].基于边缘帧差和高斯混合模型的行人目标检测[J]. 计算机应用研究 2018(04)
    • [29].基于高斯混合模型的农电企业发展状况研究[J]. 能源技术经济 2011(08)
    • [30].自适应高斯混合模型语音增强方法[J]. 应用科技 2009(07)

    标签:;  ;  

    基于混合特征和高斯混合模型的说话人识别研究
    下载Doc文档

    猜你喜欢