话者识别中失配信息补偿理论和方法研究

话者识别中失配信息补偿理论和方法研究

论文摘要

在文本无关的话者识别中,尤其以NIST话者测评为代表的复杂环境下电话手机语音的话者识别,训练语音与测试语音的失配是导致识别系统性能下降的重要因素。这种失配包含语音类失配和外部干扰失配两种:包括训练和测试文本内容不同的影响,周围环境噪声的影响,语音信号采集设备(话筒)的影响,传输调制信道的影响等。除此之外,还有说话人自身因素的影响,情绪变化等。如何对这些失配信息进行准确而有效的补偿是当前话者识别研究领域的热点问题。论文针对复杂环境下电话手机语音识别系统的失配问题,围绕如何解决当前失配方法的不足,更加有效的对上述两种失配进行补偿,如何提高训练和测试失配补偿的速度,如何将失配补偿与区分性系统结合起来等方面进行了深入的研究。论文首先深入分析了现有的一些失配补偿方法的思路和算法实现细节。针对语音类失配问题,从训练和测试两个角度详细分析了在GMM-UBM框架下UBM模型在话者模型训练和评分测试中所起到的重要的基准作用,以及通过测验语音与目标话者模型和UBM模型的评分相减来解决语音类失配的问题。针对外部影响失配问题,详细介绍了现有的一些基于特征域、模型域、评分域的失配补偿方法,并分析了这些失配补偿方法的不足之处,主要体现在需要信道分类器对语音进行信道判决,只能针对孤立的信道类别进行补偿,以及信道分类器判决可能出现误判,训练信道分类器也需要相应的信道标记的语音。这都限制了当前已有的一些失配补偿方法的效果。论文针对语音类和外部干扰两类失配问题和现有失配补偿方法存在的不足之处,将因子分析方法用于估计说话人确认中训练和测试受到的失配影响,详细分析了在基于因子分析的失配补偿方法中,如何构建失配信息空间和话者信息空间,并通过这两个信息空间估计语音所受到的失配影响大小(对应为失配因子),其失配补偿是按照实际的失配影响大小而不是通道类别进行补偿,无需利用信道模型判决语音的信道种类,避免信道种类判决错误的影响。故其连续相对的补偿效果要优于传统的失配补偿方法。在NIST SRE 2008测评中我们将本方法应用于长语音任务中,在50多家国际参赛机构中排名第一。论文还利用话者信息空间解决短语音利用MAP方法据估计话者模型的不足问题,实验结果效果明显,相对提高17%左右。为了提高语音在失配补偿时的速度,论文提出了一种基于CUBM选择模型和因子分析的快速失配补偿方法。CUBM由UBM高斯分量通过KL距离准则和自底向上的分层聚类得到的高斯混合模型。在失配补偿时,利用CUBM选择模型为每帧语音特征矢量选择一组相应的UBM高斯分量,只用这些高斯分量计算相应的EM统计量,可以显著降低失配补偿的计算量。论文还提出了一种基于Top-N的选择策略,以提高UBM高斯分量的选择精度,平衡系统性能和失配补偿计算量之间的矛盾。在NIST SRE 2006主任务上的实验表明,基于CUBM选择模型的快速失配补偿方法在取得和原始失配补偿方法相近的系统性能的同时,计算量降为原来的八分之一左右,解决了失配补偿方法应用中的计算量问题。论文提出将失配补偿和SVM区分性话者识别系统结合起来的一种方法。当SVM输入是GMM均值超矢量时,SVM的训练样本(目标和冒认话者的GMM均值超矢量)在模型域进行补偿,测试时,测试语音也同样提取相应的GMM均值超矢量,在模型域补偿后与SVM话者模型测试。在NIST SRE 2008核心任务的实验表明,失配补偿后的SVM系统性能比补偿后的GMM系统性能有7%左右的提高,比补偿前的SVM系统性能相对提高24%。实验结果充分说明了失配补偿方法对区分性话者识别系统性能提升的重要意义。论文的研究工作得到了国家留学基金委2009年度国家公派高水平研究生项目(No.2009634072)和中国科学技术大学研究生创新基金(No.KD2008056)的资助。

论文目录

  • 摘要
  • ABSTRACT
  • 表格
  • 插图
  • 第一章 绪论
  • 1.1 话者识别概述
  • 1.1.1 话者识别发展介绍
  • 1.1.2 话者识别的分类
  • 1.2 文本无关话者确认系统
  • 1.2.1 文本无关话者确认系统
  • 1.2.2 话者确认系统的评测标准
  • 1.3 话者识别中的失配补偿问题
  • 1.3.1 语音类失配
  • 1.3.2 外部干扰失配
  • 1.4 论文主要内容与安排
  • 第二章 话者确认中失配补偿基本方法与思想
  • 2.1 引言
  • 2.2 话者识别系统中的UBM
  • 2.3 特征域失配补偿
  • 2.3.1 倒谱均值方差规整
  • 2.3.2 RASTA滤波
  • 2.3.3 特征弯折
  • 2.3.4 特征映射
  • 2.4 模型域失配补偿
  • 2.4.1 说话人模型合成
  • 2.5 评分域失配补偿
  • 2.5.1 零规整
  • 2.5.2 测试规整
  • 2.5.3 信道评分规整
  • 2.6 现有失配方法对比与分析
  • 2.7 本章小结
  • 第三章 基于因子分析的话者确认失配补偿
  • 3.1 引言
  • 3.2 因子分析
  • 3.3 因子分析用于话者确认失配补偿的思想
  • 3.4 因子分析话者模型的估计
  • 3.4.1 EM 统计量的计算
  • 3.4.2 失配因子的估计
  • 3.4.3 话者因子的估计
  • 3.4.4 失配信息空间的估计
  • 3.5 失配补偿的测试方法
  • 3.6 短语音的语音类失配补偿
  • 3.6.1 话者信息空间估计
  • 3.6.2 MAP 与话者信息空间对比
  • 3.7 实验
  • 3.7.1 实验数据集
  • 3.7.2 JFA 用于GMM-UBM系统
  • 3.7.3 失配空间大小的影响
  • 3.7.4 语音长度的影响
  • 3.8 短语音语音类失配补偿实验
  • 3.8.1 实验数据集
  • 3.8.2 话者信息空间大小的影响
  • 3.8.3 话者模型混合度大小影响
  • 3.9 本章小结
  • 第四章 基于CUBM的快速因子分析失配补偿
  • 4.1 引言
  • 4.2 因子分析失配补偿中的计算量分析
  • 4.3 因子分析失配补偿快速实现的基本思想
  • 4.4 基于CUBM 的快速失配补偿实现
  • 4.4.1 高斯分布的KL 距离度量
  • 4.4.2 UBM高斯分布的合并聚类
  • 4.4.3 快速失配补偿的训练和测试
  • 4.4.4 基于TOP-N的选择策略
  • 4.5 实验
  • 4.5.1 实验数据集
  • 4.5.2 快速失配补偿的结果
  • 4.5.3 TOP-N的实验结果与分析
  • 4.6 本章小结
  • 第五章 区分性话者模型中的失配补偿
  • 5.1 引言
  • 5.2 SVM话者模型
  • 5.2.1 线性可分情况
  • 5.2.2 线性不可分及高维映射
  • 5.2.3 SVM用于话者识别
  • 5.3 SVM话者模型的失配补偿
  • 5.3.1 SVM训练阶段失配补偿
  • 5.3.2 SVM测试失配补偿
  • 5.4 实验
  • 5.4.1 实验数据集
  • 5.4.2 GMM-SVM与GMM系统结果对比
  • 5.4.3 失配补偿后的SVM与GMM结果对比
  • 5.4.4 SVM失配补偿前后结果对比
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 本论文工作总结
  • 6.2 进一步研究工作
  • 参考文献
  • 致谢
  • 在读期间发表的学术论文与取得的研究成果
  • 相关论文文献

    • [1].面对“失配性疾病”的对策不能失配(三)——读《人体的故事》有感[J]. 慢性病学杂志 2018(03)
    • [2].黄河流域旅游产业高质量发展的失配度时空格局及成因分析[J]. 干旱区资源与环境 2020(12)
    • [3].国内外空间失配理论的研究进展述评[J]. 经济地理 2013(03)
    • [4].光伏方阵串并联失配损失的测试与分析[J]. 电子测试 2016(13)
    • [5].城市“空间失配”的形成机制研究——以杭州为例[J]. 浙江工业大学学报(社会科学版) 2015(02)
    • [6].上海市的空间失配及其原因[J]. 城市问题 2014(06)
    • [7].空间失配研究态势的文献计量分析[J]. 中国房地产 2013(24)
    • [8].失配性质对二维失配铝膜结构及位错形成的影响[J]. 有色金属科学与工程 2011(05)
    • [9].失配性疾病预防档案数据库的构建[J]. 山西档案 2018(06)
    • [10].面对“失配性疾病”的对策不能失配(二)——读《人体的故事》有感[J]. 慢性病学杂志 2018(02)
    • [11].空间失配:新城区理想与现实的落差[J]. 上海房地 2010(01)
    • [12].面对“失配性疾病”的对策不能失配(四)——读《人体的故事》有感[J]. 慢性病学杂志 2018(04)
    • [13].最小化感知失配与对外汉语教学[J]. 教学研究 2017(02)
    • [14].遗传与进化视角下人类“失配现象”之辨析[J]. 医学与哲学 2019(15)
    • [15].形成性评估与课堂教学感知失配现象研究[J]. 开封教育学院学报 2014(11)
    • [16].农村公共产品供给的价值失配及其协同策略分析[J]. 公安研究 2013(05)
    • [17].教育的空间效应:均衡还是失配?——以西安市小学教育资源为例[J]. 干旱区资源与环境 2018(05)
    • [18].通道失配对阵列雷达处理性能影响建模仿真[J]. 计算机仿真 2016(07)
    • [19].农村公共产品供给的价值失配及其协同策略分析[J]. 长白学刊 2013(01)
    • [20].基于失配序列的OFDM同步算法[J]. 半导体技术 2010(09)
    • [21].基于光伏组串I-V特性的并联失配检测[J]. 发电与空调 2016(01)
    • [22].浅海环境参数失配对匹配场处理的影响分析[J]. 计算机仿真 2013(06)
    • [23].基于失配信息子空间失配补偿的话者确认[J]. 中国科学技术大学学报 2010(08)
    • [24].东北地区基本公共服务失配度时空格局演化与形成机理[J]. 经济地理 2015(03)
    • [25].城市空间失配与交通拥堵——对北京市“职住失衡”和公共服务过度集中的实证研究[J]. 经济体制改革 2016(03)
    • [26].基于最小二乘的TIADC通道失配估计[J]. 四川大学学报(工程科学版) 2011(01)
    • [27].时间失配对非线性光纤环镜的影响[J]. 上海理工大学学报 2009(06)
    • [28].艺术专业大学生的专业失配现状及对策探讨——基于南京艺术学院流行音乐学院部分专业失配大学生情况分析[J]. 教育教学论坛 2013(50)
    • [29].河北省基本公共文化服务失配度时空演化与影响因素[J]. 河北经贸大学学报(综合版) 2020(02)
    • [30].焊接接头力学失配对断裂参量的影响[J]. 教育教学论坛 2017(32)

    标签:;  ;  ;  ;  

    话者识别中失配信息补偿理论和方法研究
    下载Doc文档

    猜你喜欢