基于话者统计特征和SVM的文本无关话者确认研究

基于话者统计特征和SVM的文本无关话者确认研究

论文摘要

随着信息化地不断深入,话者确认等身份识别方法越来越受到人们的重视。话者确认,尤其是用户界面友好的与文本无关的话者确认,以其广阔的市场前景,吸引了越来越多的研究人员的重视,成为目前研究的重点。话者确认是一个分类问题。支持向量机(Support Vector Machine,SVM)是一种分类能力很强的分类器,目前在模式分类中运用广泛。但是,SVM是一种针对小样本的机器学习算法,在处理需要较长语音的文本无关话者确认时,面临着短时特征矢量样本数量大、数据混叠严重、目标话者和冒人话者样本数量不平衡等问题。此外,SVM只考虑分类面上的支持向量,而单一帧短时特征缺少话者整体信息,因此基于短时特征的SVM话者确认还面临着单一帧缺乏话者特征信息的问题。这些问题制约了SVM用于话者确认,影响了基于SVM的话者确认的性能。针对SVM用于文本无关话者确认存在的问题,本文提出了基于统计信息的话者特征提取方法,将大样本的、混叠严重的、单一帧缺乏话者整体信息的短时特征转化为小样本的、高维的、具有话者整体信息、适合SVM建模的统计话者特征,运用于SVM话者建模,提高了与文本无关的话者确认的性能。本文提出了一种基于概率分布泰勒展开的话者统计特征提取方法,采用各阶泰勒展开项的微商部分作为话者统计特征。泰勒公式(Taylor’s theorem)表明可以用函数某点的各阶导数值重构该点邻域内的该函数。在话者确认问题上,对于两个语音观测序列,通过比较两个话者特征概率分布函数在同一点处的各阶泰勒展开项的微商值,可以确定这两个GMM是否相同,从而判定这两个语音观测序列是否属于同一个人。用GMM拟合话者短时倒谱参数的概率分布,然后对GMM进行泰勒展开,求取GMM的各阶泰勒展开项的微商值作为话者统计特征。此话者统计特征代表了话者特征概率分布函数的特性。此方法能够将短时特征转化为小样本的、高维的、具有话者整体特征的话者统计特征,可用于话者确认,提高话者确认的性能。本文还提出了一种基于多阶矩统计量的话者统计特征提取方法,将短时参数变换为多阶矩统计量话者统计特征。短时特征数量众多、所含信息复杂,需要进行加工以提取话者个性信息,矩统计量是统计“加工”的常用方法。每条语音的参数序列在一个与话者无关的统一模板上统计该语音的各阶矩统计量,不仅可以获得权重、均值和方差等低阶矩话者信息,还可以获得三阶矩等较高阶矩话者信息。作为话者统计特征,各种矩含有不同的话者个性信息,能够很好的提取话者个性信息,提高话者确认性能。由于不同统计特征反映了话者个性特征的不同方面,因此在前面两种话者统计特征的基础上,本论文提出了多种话者统计特征的多SVM话者确认的方法,即用基于概率分布泰勒展开的话者统计特征和基于多阶矩统计量的话者统计特征分别建立SVM话者模型,然后将这两个SVM话者确认子系统输出评分线性融合。在NIST数据库上的实验表明,这种结合能够进一步提高话者确认的性能。与主流的GMM-UBM系统相比,融合后系统的EER相对提高了42.0%(男性)以及28.0%(女性)。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 话者识别概况
  • 1.2 文本无关话者确认
  • 1.2.1 话者确认系统的组成
  • 1.2.2 话者确认系统的评估
  • 1.3 文本无关话者确认的主要问题
  • 1.3.1 文本无关话者确认的特征参数
  • 1.3.2 文本无关话者确认的分类器
  • 1.3.3 文本无关话者确认中话者统计特征的提取
  • 1.4 NIST 话者识别评测及其语料库
  • 1.5 论文的主要内容及章节安排
  • 第2章 文本无关话者确认的基本方法
  • 2.1 引言
  • 2.2 语音信号的特征提取及处理
  • 2.2.1 Mel 频率倒谱参数提取
  • 2.2.2 特征后处理
  • 2.3 话者模型
  • 2.3.1 高斯混合模型(GMM)
  • 2.3.1.1 高斯混合模型及其参数估计
  • 2.3.1.2 GMM-UBM 及其参数估计
  • 2.3.2 支持向量机(SVM)
  • 2.3.2.1 线性判决边界
  • 2.3.2.2 非线性判决边界
  • 2.3.2.3 输出评分
  • 2.4 贝叶斯风险和SVM 结构风险
  • 2.4.1 贝叶斯风险
  • 2.4.2 SVM 结构风险
  • 2.5 SVM 用于话者确认面临的问题
  • 2.5.1 大样本数据
  • 2.5.2 数据混叠严重
  • 2.5.3 单帧短时参数缺乏话者整体信息
  • 2.6 本章小结
  • 第3章 基于话者统计特征的SVM 话者确认
  • 3.1 引言
  • 3.2 话者统计特征
  • 3.2.1 话者统计特征
  • 3.2.2 研究现状
  • 3.2.3 本文方法
  • 3.3 SVM 话者模型
  • 3.3.1 冒认话者的选择
  • 3.3.2 核函数选择
  • 3.3.3 惩罚系数C 的选取
  • 3.4 基于话者统计特征的SVM 话者确认系统
  • 3.5 本章小结
  • 第4章 基于概率分布泰勒展开的话者统计特征
  • 4.1 引言
  • 4.2 话者短时倒谱参数的概率分布
  • 4.3 基于Fisher 评分的话者统计特征
  • 4.3.1 基于GMM 的Fisher 评分
  • 4.3.2 基于GMM 和UBM 的Fisher 评分
  • 4.4 基于概率分布泰勒展开的话者统计特征
  • 4.4.1 泰勒公式(Taylor’s Theorem)
  • 4.4.2 基于概率分布泰勒展开的话者统计特征
  • 4.4.4 基于概率分布泰勒展开话者统计特征的话者确认系统
  • 4.5 实验与分析
  • 4.5.1 基于Fisher 评分话者统计特征的话者确认
  • 4.5.1.1 GMM 混合度M 对系统性能的影响
  • 4.5.1.2 基于Fisher 评分话者统计特征的话者确认系统与GMM 系统的比较
  • 4.5.2 基于概率分布泰勒展开话者统计特征的话者确认
  • 4.5.2.1 各阶泰勒展开话者统计特征构建SVM 系统性能确认
  • 4.5.2.2 基于概率分布泰勒展开话者统计特征的SVM 系统性能确认
  • 4.5.3 基于概率分布泰勒展开话者统计特征的话者确认与其它方法的比较
  • 4.6 本章小结
  • 第5章 基于多阶矩统计量的话者统计特征
  • 5.1 引言
  • 5.2 基于均值的话者统计特征
  • 5.2.1 基于VQ 均值的话者统计特征
  • 5.2.2 基于GMM 均值的话者统计特征
  • 5.3 基于KL 距离的话者统计特征
  • 5.3.1 基于KL 距离的话者统计特征
  • 5.4 基于多阶矩统计量的话者统计特征
  • 5.4.1 统计量
  • 5.4.2 基于多阶矩统计量的话者统计特征
  • 5.4.3 基于多阶矩统计量话者统计特征的SVM 话者确认系统
  • 5.5 实验与分析
  • 5.5.1 基于均值话者统计特征的SVM 系统和基于KL 距离的话者统计特征SVM 系统
  • 5.5.2 基于多阶矩统计量话者统计特征的SVM 话者确认
  • 5.5.2.1 基于单阶矩统计量话者统计特征的SVM 话者确认
  • 5.5.2.2 基于多阶矩统计量话者统计特征的SVM 话者确认性能
  • 5.5.3 基于多阶矩统计量话者统计特征的SVM 话者确认与其它方法的比较
  • 5.6 本章小结
  • 第6章 多种话者统计特征话者确认
  • 6.1 引言
  • 6.2 多种话者统计特征话者确认
  • 6.2.1 多种话者统计特征
  • 6.2.2 子系统输出评分融合
  • 6.3 实验与讨论
  • 6.3.1 多统计特征的话者确认性能
  • 6.3.1.1 基于统计特征的两种话者确认系统性能比较
  • 6.3.1.2 多种统计特征的话者确认性能
  • 6.3.2 多种统计特征话者确认方法与其它方法比较
  • 6.4 本章小结
  • 第七章 总结和展望
  • 参考文献
  • 致谢
  • 攻读学位期间的主要研究工作和论文发表情况
  • 相关论文文献

    • [1].基于SVM的永磁无刷直流电机无位置传感器控制[J]. 电子产品世界 2020(01)
    • [2].基于商空间的黄金价格SVM模型预测[J]. 黄金科学技术 2020(01)
    • [3].基于主成分降维的SVM回归模型在煤与瓦斯突出预测中的应用[J]. 工业计量 2020(01)
    • [4].基于SVM的在线医疗信息服务质量关键影响因素研究[J]. 情报科学 2020(03)
    • [5].基于SVM与fMRI技术对精神分裂症的分类研究[J]. 现代计算机 2020(01)
    • [6].基于SVM算法的微博评论数据情感分析[J]. 数字通信世界 2020(01)
    • [7].基于SVM的河道洪峰水位校正预报方法[J]. 水力发电 2020(04)
    • [8].基于SVM的煤与瓦斯突出预测模型及应用[J]. 陕西煤炭 2020(02)
    • [9].基于实时电价和加权灰色关联投影的SVM电力负荷预测[J]. 电网技术 2020(04)
    • [10].基于超声波扫描和SVM的综合管廊故障诊断模型[J]. 科技与创新 2020(07)
    • [11].基于SVM理论的航空发动机飞行数据可视化建模[J]. 科技创新与应用 2020(12)
    • [12].基于SVM的固化土无侧限抗压强度模型[J]. 宁波大学学报(理工版) 2020(04)
    • [13].基于遗传算法和SVM的肝豆状核变性震颤评估方法研究[J]. 西安文理学院学报(自然科学版) 2020(03)
    • [14].基于SVM的高速公路预防性养护效果评价模型及应用[J]. 工程建设 2020(05)
    • [15].基于因子分析和SVM的网络舆情危机预警研究[J]. 重庆工商大学学报(自然科学版) 2020(05)
    • [16].基于SVM的物联网大数据有效信息过滤挖掘[J]. 河南科技 2020(26)
    • [17].基于改进SVM算法的思政教育动态预警系统研究[J]. 微型电脑应用 2020(09)
    • [18].基于SVM技术调剖(驱)潜力预测[J]. 承德石油高等专科学校学报 2019(05)
    • [19].基于海量数据的不平衡SVM增量学习的钓鱼网站检测方法[J]. 电信工程技术与标准化 2016(12)
    • [20].结合主方向和SVM的人脸表情识别[J]. 廊坊师范学院学报(自然科学版) 2016(04)
    • [21].SVM算法支持下的耕地面积退化遥感监测——以昆明市呈贡区为例[J]. 安徽农业科学 2017(01)
    • [22].矿井突水水源的SVM识别方法[J]. 辽宁工程技术大学学报(自然科学版) 2017(01)
    • [23].基于SVM算法的移动智能终端安全等级分级模型[J]. 通信技术 2017(04)
    • [24].图像视觉显著性和改进型SVM在图像分割中的研究[J]. 通讯世界 2017(08)
    • [25].一种基于决策树的SVM算法[J]. 太原学院学报(自然科学版) 2017(01)
    • [26].基于多级SVM分类的语音情感识别算法[J]. 计算机应用研究 2017(06)
    • [27].基于模糊信息粒与SVM的道路交通状态波动分析[J]. 重庆交通大学学报(自然科学版) 2017(07)
    • [28].基于SVM的上证指数预测研究[J]. 软件导刊 2017(08)
    • [29].基于集成SVM的肺部肿瘤PET/CT三模态计算机辅助诊断方法[J]. 生物医学工程研究 2017(03)
    • [30].一种基于SVM的声源定位算法[J]. 计算机技术与发展 2017(09)

    标签:;  ;  ;  ;  ;  ;  

    基于话者统计特征和SVM的文本无关话者确认研究
    下载Doc文档

    猜你喜欢