说话人识别中不同语音编码影响的补偿方法

说话人识别中不同语音编码影响的补偿方法

论文摘要

说话人识别技术因其自身独特的方便性、经济性、准确性和可扩展性等优点,在生物特征识别领域中具有广阔的应用前景。尽管在实验室环境下,说话人识别系统已经取得了比较令人满意的效果,但是现实中的各种外界因素使得系统性能明显下降。其中影响性能的主要原因之一是由于各种因素而导致的训练和测试时语音信号编码的不匹配问题。尤其是在进行网络下说话人识别时,所能获得的训练数据是采用某种语音(音频)编码方式下的信号,而在实际使用时,待测语音信号为其他编码方式的信号,这时的说话人识别就面临着训练和测试语音由于编码不同而产生的不匹配问题,这将影响说话人识别的性能。为了提高网络环境下的说话人识别性能,增强系统实用化程度,首先需要解决编码匹配问题,即消除训练语音和测试语音之间的编码不匹配对识别率的影响。本文主要研究有效克服不同语音编码影响的补偿方法,以提高网络环境下的说话人识别性能,主要是在特征域和得分域进行补偿。在编码特征补偿方面,将两种语音识别中的编码补偿方法,最大后验概率MAP(Maximum A Posterior)方法和最大似然估计ML(Maximum Likelihood)方法,应用到说话人识别系统当中。在得分补偿方面,引入信道补偿中的似然比得分补偿方法,进一步提高系统性能。在应用GMM(Gaussian Mixture Model)进行第一次识别的基础上,使用编码得分归一化,再进行二次判决,得到最终识别结果。所采用的基线系统为文本无关的说话人辨认系统。实验结果表明,首先应用MAP方法进行编码补偿,再利用似然比得分补偿进行二次判决,这样得到的开集测试的最好识别率为83.4%。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.2.1 补偿技术
  • 1.2.2 顽健特征的提取
  • 1.3 本文研究的内容
  • 第2章 基线系统和语料库建立
  • 2.1 引言
  • 2.2 说话人识别基线系统
  • 2.2.1 特征提取
  • 2.2.2 有效帧获取
  • 2.2.3 高斯混合模型
  • 2.2.4 通用背景模型
  • 2.2.5 说话人模板建立
  • 2.2.6 识别与判决策略
  • 2.3 语料库建立
  • 2.4 实验与讨论
  • 2.5 本章小结
  • 第3章 基于MAP 和ML 的编码补偿方法
  • 3.1 编码不匹配问题的影响
  • 3.2 语音编码检测器
  • 3.3 基于MAP 的编码补偿方法
  • 3.3.1 MAP 估计准则
  • 3.3.2 基于MAP 的编码补偿方法的原理
  • 3.3.3 算法实现
  • 3.4 基于ML 的编码补偿方法
  • 3.4.1 ML 估计准则
  • 3.4.2 基于ML 的编码补偿方法的原理
  • 3.4.3 算法实现
  • 3.5 实验与讨论
  • 3.5.1 编码检测器
  • 3.5.2 编码相关及编码无关模型
  • 3.5.3 比例因子的选取
  • 3.5.4 编码相关模型的实验
  • 3.5.5 编码无关模型的实验
  • 3.6 本章小结
  • 第4章 似然比得分补偿方法
  • 4.1 概述
  • 4.1.1 假设检验原理
  • 4.1.2 似然比归一化方法
  • 4.2 似然比得分补偿
  • 4.2.1 归一化参数估计准则
  • 4.2.2 得分补偿方法
  • 4.2.3 算法实现
  • 4.2.4 综合补偿
  • 4.3 实验与讨论
  • 4.3.1 集外说话人实验
  • 4.3.2 集外编码实验
  • 4.3.3 全开集实验
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  ;  

    说话人识别中不同语音编码影响的补偿方法
    下载Doc文档

    猜你喜欢