基于GMM-UBM的快速说话人识别方法

基于GMM-UBM的快速说话人识别方法

论文摘要

文本无关的说话人识别,由于其实际应用下的灵活性,而成为语音识别领域的研究重点。自从1999年美国国家标准技术研究所(National Institute of Standards and Technology,NIST)举办的评测中,高斯混合模型——通用背景模型(Gaussian Mixture Model - Universal Background Model,GMM-UBM)作为基准系统获得优异识别率后,该方向的研究都以其为基准模型,并对其进行改进。尽管说话人识别系统已经取得了比较令人满意的效果,但进行匹配前需大量的似然分计算,由于该因素的影响使得系统识别速度明显下降,因此实用性不佳。本文的主要目的是在尽量不降低识别率的前提下,减少计算量以实现快速说话人识别。针对说话人识别中计算量大、运行速度慢的情况,本文在基于树形结构的核心挑选算法基础上进行改进,自顶向下搜索UBM中输出测试语音特征矢量似然分最高的分布,此后与目标说话人模型匹配时,只需计算核心分布的似然分进行识别。改进算法应用到基准系统后,核心挑选速度提高了14.7倍。鉴于特征序列对最终的识别结果无影响,因此系统结合矢量序列重排的剪枝算法后,整个系统速度提高到21.7倍,识别率略有降低。为了提高识别率,论文中将支持向量机(Support Vector Machine,SVM)中径向基核函数引入到说话人识别中,识别率提高到与基准系统一致。本文针对女性声音在开集识别时识别率下降明显的情况提出了概率阈值的思想,应用于基准系统后速度有所下降,识别率提高了0.7%。同时对分段置信分改进来解决部分匹配情况对最终识别结果的影响,本文中采用不同的参数来进行实验比较,最终选择每一小段的平均值作为该段的置信分,然后通过三层前馈网络形成最后的置信分,实验证明与使用似然比的基准系统比较,集内正确率提高了2.6%,集外错误率下降了2%。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景及研究的目的和意义
  • 1.2 国内外在该方向上的发展历程和研究现状
  • 1.3 本文的主要研究内容
  • 第2章 GMM-UBM 基准说话人识别系统
  • 2.1 引言
  • 2.2 GMM-UBM 基准系统的建立
  • 2.2.1 前端处理
  • 2.2.2 目标人模型的建立
  • 2.2.3 似然分计算
  • 2.3 本文实验使用的语料库
  • 2.4 基准系统实验
  • 2.5 本章小结
  • 第3章 基于树的挑选和特征序列重排的快速识别
  • 3.1 引言
  • 3.2 树形结构的挑选算法
  • 3.2.1 树形结构
  • 3.2.2 树形结构的构建
  • 3.3 特征序列重排的剪枝算法
  • 3.3.1 剪枝算法的基本思想
  • 3.3.2 特征序列重排的剪枝算法
  • 3.4 基于径向基函数的识别性能改进
  • 3.5 实验与分析
  • 3.5.1 基于树形结构挑选的实验
  • 3.5.2 基于特征序列重排的实验
  • 3.5.3 树形结构挑选和特征序列重排相结合的实验
  • 3.5.4 基于径向基函数的实验
  • 3.6 本章小结
  • 第4章 说话人系统快速识别的后处理
  • 4.1 引言
  • 4.2 GMM-UBM 说话人识别的确认环节
  • 4.2.1 确认环节的背景模型
  • 4.2.2 确认环节的判定过程
  • 4.3 基于分段置信分的确认
  • 4.3.1 多种统计参数
  • 4.3.2 分段置信的基本思想
  • 4.3.3 标量分数的转换
  • 4.4 基于概率阈值的确认
  • 4.5 实验与分析
  • 4.5.1 基于分段置信分确认的实验
  • 4.5.2 基于概率阈值确认的实验
  • 4.6 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于两种GMM-UBM多维概率输出的SVM语音情感识别[J]. 计算机应用研究 2011(01)
    • [2].GMM-UBM声纹识别技术研究与应用[J]. 电脑编程技巧与维护 2017(16)
    • [3].基于GMM-UBM模型的说话人辨识研究[J]. 无线电工程 2014(12)
    • [4].基于GMM-UBM说话人模型的连续自适应算法研究[J]. 通信电源技术 2016(02)
    • [5].一种改进的基于GMM-UBM的法庭自动说话人识别系统[J]. 中国科学院大学学报 2013(06)
    • [6].基于GMM-UBM的声纹识别技术的特征参数研究[J]. 计算机技术与发展 2020(05)
    • [7].基于超音段韵律特征和GMM-UBM的文本无关的说话人识别[J]. 中国科学技术大学学报 2010(02)
    • [8].GMM-UBM和SVM说话人辨认系统及融合的分析[J]. 清华大学学报(自然科学版) 2008(S1)
    • [9].基于GMM-UBM的说话人确认系统的研究[J]. 辽宁工业大学学报(自然科学版) 2012(02)
    • [10].GMM-UBM和SVM在说话人识别中的应用[J]. 计算机系统应用 2018(01)
    • [11].基于GMM-UBM和GLDS-SVM的英文发音错误检测方法[J]. 自动化学报 2010(02)
    • [12].一种用于鲁棒性说话人确认的分段概率分布参数规整方法[J]. 电路与系统学报 2008(06)

    标签:;  ;  ;  ;  

    基于GMM-UBM的快速说话人识别方法
    下载Doc文档

    猜你喜欢