论文摘要
在文本无关的话者识别中,尤其以NIST话者测评为代表的复杂环境下电话手机语音的话者识别,训练语音与测试语音的失配是导致识别系统性能下降的重要因素。这种失配包含语音类失配和外部干扰失配两种:包括训练和测试文本内容不同的影响,周围环境噪声的影响,语音信号采集设备(话筒)的影响,传输调制信道的影响等。除此之外,还有说话人自身因素的影响,情绪变化等。如何对这些失配信息进行准确而有效的补偿是当前话者识别研究领域的热点问题。论文针对复杂环境下电话手机语音识别系统的失配问题,围绕如何解决当前失配方法的不足,更加有效的对上述两种失配进行补偿,如何提高训练和测试失配补偿的速度,如何将失配补偿与区分性系统结合起来等方面进行了深入的研究。论文首先深入分析了现有的一些失配补偿方法的思路和算法实现细节。针对语音类失配问题,从训练和测试两个角度详细分析了在GMM-UBM框架下UBM模型在话者模型训练和评分测试中所起到的重要的基准作用,以及通过测验语音与目标话者模型和UBM模型的评分相减来解决语音类失配的问题。针对外部影响失配问题,详细介绍了现有的一些基于特征域、模型域、评分域的失配补偿方法,并分析了这些失配补偿方法的不足之处,主要体现在需要信道分类器对语音进行信道判决,只能针对孤立的信道类别进行补偿,以及信道分类器判决可能出现误判,训练信道分类器也需要相应的信道标记的语音。这都限制了当前已有的一些失配补偿方法的效果。论文针对语音类和外部干扰两类失配问题和现有失配补偿方法存在的不足之处,将因子分析方法用于估计说话人确认中训练和测试受到的失配影响,详细分析了在基于因子分析的失配补偿方法中,如何构建失配信息空间和话者信息空间,并通过这两个信息空间估计语音所受到的失配影响大小(对应为失配因子),其失配补偿是按照实际的失配影响大小而不是通道类别进行补偿,无需利用信道模型判决语音的信道种类,避免信道种类判决错误的影响。故其连续相对的补偿效果要优于传统的失配补偿方法。在NIST SRE 2008测评中我们将本方法应用于长语音任务中,在50多家国际参赛机构中排名第一。论文还利用话者信息空间解决短语音利用MAP方法据估计话者模型的不足问题,实验结果效果明显,相对提高17%左右。为了提高语音在失配补偿时的速度,论文提出了一种基于CUBM选择模型和因子分析的快速失配补偿方法。CUBM由UBM高斯分量通过KL距离准则和自底向上的分层聚类得到的高斯混合模型。在失配补偿时,利用CUBM选择模型为每帧语音特征矢量选择一组相应的UBM高斯分量,只用这些高斯分量计算相应的EM统计量,可以显著降低失配补偿的计算量。论文还提出了一种基于Top-N的选择策略,以提高UBM高斯分量的选择精度,平衡系统性能和失配补偿计算量之间的矛盾。在NIST SRE 2006主任务上的实验表明,基于CUBM选择模型的快速失配补偿方法在取得和原始失配补偿方法相近的系统性能的同时,计算量降为原来的八分之一左右,解决了失配补偿方法应用中的计算量问题。论文提出将失配补偿和SVM区分性话者识别系统结合起来的一种方法。当SVM输入是GMM均值超矢量时,SVM的训练样本(目标和冒认话者的GMM均值超矢量)在模型域进行补偿,测试时,测试语音也同样提取相应的GMM均值超矢量,在模型域补偿后与SVM话者模型测试。在NIST SRE 2008核心任务的实验表明,失配补偿后的SVM系统性能比补偿后的GMM系统性能有7%左右的提高,比补偿前的SVM系统性能相对提高24%。实验结果充分说明了失配补偿方法对区分性话者识别系统性能提升的重要意义。论文的研究工作得到了国家留学基金委2009年度国家公派高水平研究生项目(No.2009634072)和中国科学技术大学研究生创新基金(No.KD2008056)的资助。
论文目录
相关论文文献
- [1].面对“失配性疾病”的对策不能失配(三)——读《人体的故事》有感[J]. 慢性病学杂志 2018(03)
- [2].黄河流域旅游产业高质量发展的失配度时空格局及成因分析[J]. 干旱区资源与环境 2020(12)
- [3].国内外空间失配理论的研究进展述评[J]. 经济地理 2013(03)
- [4].光伏方阵串并联失配损失的测试与分析[J]. 电子测试 2016(13)
- [5].城市“空间失配”的形成机制研究——以杭州为例[J]. 浙江工业大学学报(社会科学版) 2015(02)
- [6].上海市的空间失配及其原因[J]. 城市问题 2014(06)
- [7].空间失配研究态势的文献计量分析[J]. 中国房地产 2013(24)
- [8].失配性质对二维失配铝膜结构及位错形成的影响[J]. 有色金属科学与工程 2011(05)
- [9].失配性疾病预防档案数据库的构建[J]. 山西档案 2018(06)
- [10].面对“失配性疾病”的对策不能失配(二)——读《人体的故事》有感[J]. 慢性病学杂志 2018(02)
- [11].空间失配:新城区理想与现实的落差[J]. 上海房地 2010(01)
- [12].面对“失配性疾病”的对策不能失配(四)——读《人体的故事》有感[J]. 慢性病学杂志 2018(04)
- [13].最小化感知失配与对外汉语教学[J]. 教学研究 2017(02)
- [14].遗传与进化视角下人类“失配现象”之辨析[J]. 医学与哲学 2019(15)
- [15].形成性评估与课堂教学感知失配现象研究[J]. 开封教育学院学报 2014(11)
- [16].农村公共产品供给的价值失配及其协同策略分析[J]. 公安研究 2013(05)
- [17].教育的空间效应:均衡还是失配?——以西安市小学教育资源为例[J]. 干旱区资源与环境 2018(05)
- [18].通道失配对阵列雷达处理性能影响建模仿真[J]. 计算机仿真 2016(07)
- [19].农村公共产品供给的价值失配及其协同策略分析[J]. 长白学刊 2013(01)
- [20].基于失配序列的OFDM同步算法[J]. 半导体技术 2010(09)
- [21].基于光伏组串I-V特性的并联失配检测[J]. 发电与空调 2016(01)
- [22].浅海环境参数失配对匹配场处理的影响分析[J]. 计算机仿真 2013(06)
- [23].基于失配信息子空间失配补偿的话者确认[J]. 中国科学技术大学学报 2010(08)
- [24].东北地区基本公共服务失配度时空格局演化与形成机理[J]. 经济地理 2015(03)
- [25].城市空间失配与交通拥堵——对北京市“职住失衡”和公共服务过度集中的实证研究[J]. 经济体制改革 2016(03)
- [26].基于最小二乘的TIADC通道失配估计[J]. 四川大学学报(工程科学版) 2011(01)
- [27].时间失配对非线性光纤环镜的影响[J]. 上海理工大学学报 2009(06)
- [28].艺术专业大学生的专业失配现状及对策探讨——基于南京艺术学院流行音乐学院部分专业失配大学生情况分析[J]. 教育教学论坛 2013(50)
- [29].河北省基本公共文化服务失配度时空演化与影响因素[J]. 河北经贸大学学报(综合版) 2020(02)
- [30].焊接接头力学失配对断裂参量的影响[J]. 教育教学论坛 2017(32)