说话人识别中信息融合算法的研究

说话人识别中信息融合算法的研究

论文摘要

摘要:本文通过对说话人认证系统中的特征级融合、匹配分数级融合、决策级融合与多层级融合各种信息融合算法的研究,进一步提高了系统的认证精度,以便更好地解决关系国计民生的公共信息安全问题。针对各个融合层级发现的问题,本文分别从建立特征级融合理论、提出匹配分数级融合特征选择算法、提出多层级融合理论三个角度进行了研究。本文主要贡献有:1.本文按照信息融合生物识别系统中存在的特征级、匹配分数级与决策级三种融合层级,对现有信息融合说话人识别算法进行归纳,并对匹配分数融合说话人识别算法进行子类划分。然后,针对各融合层级遇到的问题与不足,具体工作有:2.针对特征层级存在的问题,本文提出了一种基于关系度量融合框架的特征级融合算法。以此关系度量框架为理论依据建立了一种基于特征级融合的说话人认证算法,通过引入最大Kullback-Leibler距离计算特征级融合的有效信息量,首次从信息论角度阐述了特征级融合优于说话人识别中常用的匹配分数融合的原因。实验结果显示特征级融合算法较传统匹配分数算法可以获取更多的有效信息量,得到了比匹配分数融合和单模态算法更优的性能。最佳情况下,特征级融合算法的等错误率比传统匹配分数融合降低了3.88%,比单模态算法降低了7.3%。3.针对匹配分数层级存在的问题,本文提出了一种基于Spearman相关系数的匹配分数融合特征选择算法。在匹配分数融合过程中,如何选择两种相关性较小的匹配分数是提高融合后系统性能的关键。目前业内缺乏衡量这种相关性的度量。本文首次引入Spearman相关系数来衡量匹配分数之间相关性,并且利用多项式曲线拟合Spearman系数分别与等错误率、MinDCF之间的关系,验证了该系数的有效性。进一步引入Kullback-Leibler距离分析了与Spearman系数之间的关系,再次验证了Spearman系数的有效性。通过Spearman系数对6种话语特征共15种两特征融合方案的匹配分数相关性的实验评估,进行了最优融合特征的选择,选出了MFCC与residual phase的最佳融合方案,并将Spearman系数与其它典型相关性度量进行时效性比较,验证其时效性最优,适合大量话语特征的快速选择。4.针对决策级融合存在的问题,本文首次提出了一种多层级融合说话人识别框架理论,在框架中分别定义了一种强多层级融合、三种弱多层级融合的四种多层级融合概念。针对两特征融合实例,分别讨论了以上四种多层级融合情况,提出了一种两特征的匹配分数、决策级融合多层级融合算法,验证了多层级融合理论的可行性。实验结果显示该算法性能均优于传统匹配分数算法、单模态算法。最优情况下,比传统单模系统等错误率降低了18.63%。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 生物特征识别技术概述
  • 1.2 信息融合生物识别技术概述
  • 1.3 信息融合说话人识别的研究意义与研究现状
  • 1.3.1 信息融合说话人识别的研究意义
  • 1.3.2 说话人识别技术
  • 1.3.3 信息融合说话人识别的研究现状
  • 1.3.4 现有信息融合说话人识别存在的问题
  • 1.4 本文研究内容与结构安排
  • 1.4.1 论文的主要工作
  • 1.4.2 各章内容简介
  • 第二章 说话人识别中信息融合算法的层级框架结构
  • 2.1 信息融合说话人识别的融合方式
  • 2.1.1 特征级融合说话人识别
  • 2.1.2 匹配分数级融合说话人识别
  • 2.1.3 决策级融合说话人识别
  • 2.2 说话人识别评估标准NIST-SRE语料库
  • 2.3 说话人识别的话语特征概述
  • 2.3.1 短时谱特征
  • 2.3.2 声音源特征
  • 2.3.3 临时谱特征
  • 2.3.4 韵律特征
  • 2.3.5 高级别特征
  • 2.4 说话人识别典型算法模型
  • 2.4.1 矢量量化方法
  • 2.4.2 隐式马尔科夫模型
  • 2.4.3 高斯混合模型
  • 2.4.4 GMM-UBM算法框架
  • 2.4.5 支持向量机
  • 2.5 本章小结
  • 第三章 基于关系度量融合框架的特征级融合说话人认证算法
  • 3.1 相关研究
  • 3.1.1 关系度量融合框架
  • 3.1.2 pH话语特征
  • 3.1.3 等错误率EER与最小检测代价函数MinDCF
  • 3.2 基于关系度量融合框架的特征级融合说话人认证算法
  • 3.2.1 特征级融合说话人认证算法步骤
  • 3.2.2 RMF框架下融合算子融合方法的讨论
  • 3.3 特征级融合说话人认证算法的信息量理论分析
  • 3.3.1 最大Kullback-Leibler距离
  • 3.3.2 特征级融合说话人认证算法的信息量评估
  • 3.3.3 匹配分数级融合说话人认证算法的信息量评估
  • 3.4 实验结果与讨论
  • 3.4.1 实验环境配置
  • 3.4.2 算法实验结果与性能对比
  • 3.4.3 特征级融合与匹配分数级融合的信息量比较
  • 3.5 本章小结
  • 第四章 Spearman相关系数最优特征选择算法
  • 4.1 Spearman相关系数特征选择算法
  • 4.1.1 Spearman相关系数定义
  • 4.1.2 匹配分数样本序列
  • 4.1.3 特征选择算法步骤
  • 4.1.4 话语特征对象
  • 4.1.5 Spearman相关系数计算样例
  • 4.2 Spearman系数与EER、MinDCF之间的关系分析
  • 4.3 利用Kullback-Leibler距离验证Spearman相关系数
  • 4.4 实验结果与讨论
  • 4.4.1 实验环境配置
  • 4.4.2 Spearman相关系数的计算结果
  • 4.4.3 Spearman系数与EER之间的关系
  • 4.4.4 Spearman系数与MinDCF之间的关系
  • 4.4.5 利用Kullback-Leibler距离验证Speannan系数
  • 4.4.6 Spearman相关系数与几种相关性度量的性能比较
  • 4.5 本章小结
  • 第五章 基于多层级融合理论的信息融合说话人认证算法
  • 5.1 多层级融合说话人识别框架
  • 5.2 决策级核融合概念
  • 5.2.1 多核学习核融合概述
  • 5.2.2 典型多核学习方法
  • 5.3 两特征多层级融合算法
  • 5.3.1 两特征多层级融合算法的可行性讨论
  • 5.3.2 两特征多层级融合算法
  • 5.4 实验结果与讨论
  • 5.4.1 实验环境配置
  • 5.4.2 MVDR话语特征
  • 5.4.3 MFCC与residual phase多层级融合实验结果与讨论
  • 5.4.4 MFCC与MVDR多层级融合实验结果与讨论
  • 5.5 本章小结
  • 第六章 结论
  • 6.1 本论文研究成果
  • 6.2 对后续工作的展望
  • 第七章 (附章):一种有效提取SIFT特征的低分辨率掌纹图像增强新算法
  • 7.1 相关算法
  • 7.1.1 反锐化掩模算法
  • 7.1.2 OS反锐化掩模算法
  • 7.1.3 非线性反锐化掩模算法
  • 7.2 局部熵的概念
  • 7.2.1 局部直方图熵
  • 7.2.2 局部灰度熵
  • 7.3 局部熵反锐化掩模掌纹图像增强算法
  • 7.3.1 掌纹图像灰度调整与归一化
  • 7.3.2 计算局部灰度熵
  • 7.3.3 计算增强因子
  • 7.4 实验与讨论
  • 7.4.1 本章实验
  • 7.4.2 本章讨论
  • 7.5 本章小结
  • 参考文献
  • 作者简历
  • 攻读博士学位期间发表的论文
  • 学位论文数据集
  • 相关论文文献

    • [1].兼顾特征级和决策级融合的场景分类[J]. 计算机应用 2016(05)
    • [2].基于特征级融合方法的高光谱影像建筑物提取[J]. 地理空间信息 2018(04)
    • [3].图像和雷达传感器特征级数据融合方法研究[J]. 计算机与数字工程 2013(11)
    • [4].特征级融合方法及其在医学图像方面的应用[J]. 计算机应用与软件 2019(04)
    • [5].一种基于特征级融合的多模态生物特征识别方法[J]. 科学技术与工程 2012(13)
    • [6].基于特征级潜在信息的多生物特征识别方法[J]. 实验室研究与探索 2019(01)
    • [7].特征级图像融合及在医学图像中的应用研究[J]. 电视技术 2016(12)
    • [8].基于特征级融合的多波段舰船目标识别方法[J]. 光谱学与光谱分析 2017(06)
    • [9].一种基于关系度量融合框架的说话人认证特征级融合算法[J]. 自动化学报 2011(12)
    • [10].基于耦合度量学习的特征级融合方法及在步态识别中的应用[J]. 东南大学学报(自然科学版) 2013(S1)
    • [11].区域物化探信息特征级融合识别地质体的方法研究[J]. 黑龙江科技信息 2013(29)
    • [12].特征级信息融合方法研究[J]. 电脑知识与技术 2009(13)
    • [13].特征级数据融合在医学图像检索中的应用[J]. 计算机工程与应用 2010(06)
    • [14].基于特征级和决策级融合的人脸吸引力评价方法[J]. 计算机应用 2018(12)
    • [15].基于NCT的特征级图像融合[J]. 计算机工程 2011(16)
    • [16].特征级多模态医学图像融合技术的研究与进展[J]. 生物医学工程学杂志 2016(02)
    • [17].带式输送机故障准确诊断方法[J]. 金属矿山 2020(04)
    • [18].综合像素级和特征级的建筑物变化检测方法[J]. 计算机科学 2013(01)
    • [19].基于分段损失的生成对抗网络[J]. 计算机工程 2019(05)
    • [20].基于Bayes理论的粮情测控系统多传感器特征级信息融合研究[J]. 河南工业大学学报(自然科学版) 2009(04)
    • [21].一种注意力机制的多波段图像特征级融合方法[J]. 西安电子科技大学学报 2020(01)
    • [22].滚动轴承故障信息的特征级融合与决策级融合[J]. 机械研究与应用 2016(01)
    • [23].融合模糊认知图用于语音情感识别[J]. 计算机工程与应用 2017(15)
    • [24].多传感器图像融合技术及其进展[J]. 测绘与空间地理信息 2010(02)
    • [25].基于时空序贯融合的TBM拦截效果评估[J]. 火力与指挥控制 2015(02)
    • [26].基于WPT/PCA的特征级融合人脸识别方法[J]. 武汉理工大学学报 2009(17)
    • [27].数据融合在护理机器人排便监测中的应用研究[J]. 机械设计与制造 2020(11)
    • [28].基于2DPCA的弹道导弹目标特征级综合识别方法[J]. 装甲兵工程学院学报 2018(04)
    • [29].遗传BP算法在特征级遥感影像融合中的应用[J]. 测绘工程 2008(06)
    • [30].对马尔可夫随机场特征级图像融合的改进[J]. 计算机工程与应用 2011(32)

    标签:;  ;  ;  ;  ;  ;  

    说话人识别中信息融合算法的研究
    下载Doc文档

    猜你喜欢