基于混合高斯模型的说话人识别

基于混合高斯模型的说话人识别

论文摘要

本论文研究的是基于混合高斯模型下的与文本无关的说话人识别问题。本论文的目标是尽量提高说话人识别率,在这篇论文中,从前端特征处理,针对超短时说话人语音建模方法,高层信息在说话人识别中的应用等各个方面展开了研究,对传统方法做了一系列的改进,并且获得了实验的证明,主要集中在以下几个方面:说话人识别传统的在特征端进行去信道信息处理的特征映射方法是机械的使用语音的信道标注信息。在本文中提出通过利用半监督聚类方法,对数据的信道标注信息做修正,再进行特征映射。从实验结果看,改进后的特征映射方法可以使原来的传统特征映射方法对性能的改善由2%提升至6%。说话人识别在应用方向上的发展一直受到短时语音识别性能的影响,在短时语音中,传统混合高斯模型建模的方法由于受到数据量的限制表现的性能一直很差,在本文中利用本征音方法对短时语音进行建模,在实验中使得系统的等错误率相对与传统系统有18%的降低。最近几年,由于音素识别器技术的发展,高层信息在说话人识别中的应用成为了研究热点。本文中提出通过音素发音方式不同对音素进行分类,并在这之上利用并行音素级混合高斯模型来对语音进行建模。通过实验验证,基于并行音素级混合高斯模型的方法与作为基线系统的使用联合因子分析的混合高斯模型的方法相比,等错误率相对下降了17%以上,而最小检测代价也相对下降了10%左右。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 说话人识别技术的发展历程和应用背景
  • 1.2 说话人识别的研究背景
  • 1.2.1 说话人识别任务的分类
  • 1.2.2 论文的研究目标
  • 1.3 说话人识别的基本问题
  • 1.3.1 说话人识别系统的结构
  • 1.3.2 性能评测方法
  • 1.3.3 数据库
  • 1.4 本论文的内容安排
  • 第二章 基于混合高斯模型的说话人识别
  • 2.1 说话人识别建模概述
  • 2.2 说话人识别中的建模问题
  • 2.2.1 冒认者模型的建立
  • 2.2.2 说话人模型的建立
  • 2.3 后端得分规整
  • 2.3.1 零规整(ZNorm)
  • 2.3.2 测试规整(TNorm)
  • 2.3.3 TZNorm与ZTNorm
  • 2.4 本章小结
  • 第三章 说话人识别前端特征处理
  • 3.1 说话人语音特征参数的提取
  • 3.1.1 MFCC特征参数提取
  • 3.1.2 LPCC特征参数提取
  • 3.1.3 PLP特征参数提取
  • 3.2 利用信道间映射去除信道影响的方法
  • 3.2.1 传统的说话人模型合成方法
  • 3.2.2 传统的Feature Mapping方法
  • 3.2.3 改进后的Feature Mapping方法
  • 3.3 实验结果和性能
  • 3.3.1 实验数据库
  • 3.3.2 Feature Mapping的实验性能
  • 3.4 本章小结
  • 第四章 超短时语音的说话人识别
  • 4.1 超短时说话人建模上Eigenvoice的优势
  • 4.2 Eigenvoice方法
  • 4.3 实验结果和性能
  • 4.3.1 实验数据库
  • 4.3.2 实验结果与性能
  • 4.4 本章小结
  • 第五章 应用语音高层信息的说话人识别
  • 5.1 应用语音高层信息的说话人识别的基本结构
  • 5.2 音素分类标准的介绍
  • 5.2.1 音素分类理论
  • 5.2.2 音素分类标准
  • 5.3 实验结果和性能
  • 5.3.1 不同音素类的性能比较
  • 5.3.2 Paral PGMM的实验性能
  • 5.4 本章小结
  • 第六章 结束语
  • 参考文献
  • 致谢
  • 在读期间发表的学术论文与取得的其他研究成果
  • 发表论文
  • 研究工作
  • 相关论文文献

    • [1].基于说话人的音频分割与聚类[J]. 心智与计算 2010(02)
    • [2].基于变分贝叶斯改进的说话人聚类算法[J]. 数据采集与处理 2017(01)
    • [3].基于说话人辨识的自上而下听觉显著性注意模型[J]. 计算机系统应用 2017(07)
    • [4].说话人用意的认知加工机制:基于误解分析的证据[J]. 外语教学 2016(04)
    • [5].“权威度”视角下终助词「ね」的附加考察[J]. 散文百家(理论) 2020(09)
    • [6].润泽有效的课堂,从引导学生学会倾听开始[J]. 快乐阅读 2016(24)
    • [7].那些有故事的“说话人”[J]. 长江丛刊 2017(01)
    • [8].汉日位移动词比较研究[J]. 唐山文学 2017(02)
    • [9].简约而不简单的英语实用口语[J]. 初中生辅导 2016(36)
    • [10].临时性词汇及其语用功能探析[J]. 青年文学家 2017(09)
    • [11].说话人意义的形成机制及其功能——“语言与人”系列研究(1)[J]. 外语学刊 2013(06)
    • [12].论词层级上说话人意义的形成因素[J]. 外语教学 2013(06)
    • [13].基于卷积长短期记忆网络的说话人辨识[J]. 信息通信 2020(08)
    • [14].说话人聚类的初始类生成方法[J]. 计算机工程与应用 2017(03)
    • [15].说话人视角下“来”的参照点问题再认识[J]. 语言教学与研究 2017(02)
    • [16].基于改进的深度神经网络的说话人辨认研究[J]. 电子器件 2017(05)
    • [17].基于语速差异的新闻发布会中首要说话人检测[J]. 计算机工程与应用 2015(04)
    • [18].一种多说话人角色聚类方法[J]. 华南理工大学学报(自然科学版) 2015(01)
    • [19].基于深层说话人矢量的说话人检索[J]. 华中科技大学学报(自然科学版) 2015(07)
    • [20].论说话人交际策略选择的影响因素[J]. 青年文学家 2014(27)
    • [21].汉语语音合成中说话人自适应的时长优化[J]. 清华大学学报(自然科学版) 2013(11)
    • [22].基于话者无关模型的说话人转换方法[J]. 模式识别与人工智能 2013(03)
    • [23].基于辨别性深度信念网络的说话人分割[J]. 清华大学学报(自然科学版) 2013(06)
    • [24].说话人分割聚类研究进展[J]. 信号处理 2013(09)
    • [25].新闻故事中的关键说话人发现方法[J]. 计算机工程与设计 2012(06)
    • [26].一种基于性别的说话人索引算法[J]. 计算机工程与科学 2012(06)
    • [27].基于NIST评测的说话人分类及定位技术研究[J]. 电子与信息学报 2011(05)
    • [28].说话人意义及其结构的研究维度——语言主观意义研究(一)[J]. 外语教学 2011(05)
    • [29].反讽话语说话人的意向及其常规推理[J]. 河北理工大学学报(社会科学版) 2010(02)
    • [30].用于说话人辨识的评分规整[J]. 计算机工程与应用 2010(12)

    标签:;  ;  ;  ;  ;  

    基于混合高斯模型的说话人识别
    下载Doc文档

    猜你喜欢