与文本无关的开集说话人识别技术研究

与文本无关的开集说话人识别技术研究

论文摘要

随着信息技术的发展,身份识别在信息安全领域发挥着越来越重要的作用。生物识别以其特有的稳定性、唯一性和方便性,逐渐成为身份识别领域中的重要研究方向。说话人识别技术是生物识别技术的一种,此技术的重点是根据说话人之间个性特征的差异来区分说话人。目前与文本相关的闭集说话人识别技术已经取得了较高的识别率,但是对于开集识别而言,识别率较低。因为开集识别要涉及到说话人辨认和阈值确认,所以辨认和阈值确认是开集识别的难点和关键。本文针对与文本无关的开集说话人识别技术,详细分析了说话人识别系统的基本原理和结构,并且对语音端点检测、特征参数提取、开集辨认、闽值确认几个部分进行了深入的研究。所做的主要工作如下:(1)预处理和语音端点检测部分,首先分析预处理和语音端点检测的重要性。然后从理论上描述基于短时能量的端点检测算法、基于短时过零率的端点检测算法、基于短时能频值的端点检测算法、基于谱熵的端点检测算法和基于改进谱熵的端点检测算法。最后对预加重和上述五个端点检测算法进行实验仿真,并对上述五个端点检测算法进行优缺点的比较。针对实验室环境下录制的说话人发音较小的特点,采用改进谱熵的端点检测算法。(2)特征提取部分,从理论上分析了参数提取方法和PCA理论。研究将PCA理论应用于特征参数的提取。仿真实验证明该方法能够在一定程度上改善识别性能,同时减少码本训练的运算时间。(3)开集辨认部分,针对传统VQ的不足,研究将FCM算法与PCA理论相结合的开集说话人辨认系统。仿真实验证明FCM+PCA具有比FCM、VQ+PCA和VQ更高的识别率。(4)开集识别部分,详细描述经典阈值、动态阈值、RS阈值的估计方法。研究将FCM+PCA辨认和RS阈值确认相结合的开集说话人识别系统。仿真实验证明此系统的EER与基于上述三种阈值的识别系统的EER相比较在一定程度上有所降低。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究背景及意义
  • 1.1.1 说话人识别介绍
  • 1.1.2 说话人识别的优势与应用前景
  • 1.1.3 说话人识别的研究意义
  • 1.2 说话人识别的研究与发展现状
  • 1.3 本文主要工作与论文结构
  • 第2章 说话人识别技术基础
  • 2.1 说话人识别系统的结构与原理
  • 2.2 说话人识别模型
  • 2.2.1 模板模型匹配
  • 2.2.2 概率模型匹配
  • 2.2.3 人工神经网络
  • 2.2.4 支持向量机
  • 2.2.5 融合方法
  • 2.3 识别性能的评价标准
  • 2.4 本章小结
  • 第3章 语音信号的预处理与端点检测
  • 3.1 语音信号的数字化与预处理
  • 3.1.1 语音信号的数字化
  • 3.1.2 预加重
  • 3.1.3 语音信号的分帧和加窗
  • 3.2 语音端点检测
  • 3.2.1 语音端点检测的目的
  • 3.2.2 语音端点检测算法
  • 3.3 本章小结
  • 第4章 说话人特征参数提取
  • 4.1 特征参数提取意义和原则
  • 4.2 特征参数提取
  • 4.2.1 美尔倒谱系数MFCC
  • 4.2.2 动态MFCC
  • 4.3 基于主成分分析的说话人特征变换
  • 4.3.1 特征参数的缺点
  • 4.3.2 PCA对特征参数去相关、降维的推导
  • 4.3.3 主成分分析转换步骤
  • 4.3.4 维数的选择
  • 4.4 本章小结
  • 第5章 聚类量化的开集说话人识别系统
  • 5.1 基于矢量量化的开集说话人辨认
  • 5.1.1 矢量量化的基本原理
  • 5.1.2 失真测度
  • 5.1.3 最佳码本设计
  • 5.1.4 基于VQ的说话人辨认
  • 5.1.5 局部PCA特征转换与VQ结合的说话人辨认
  • 5.2 基于模糊矢量量化的开集说话人辨认
  • 5.2.1 矢量量化的局限性
  • 5.2.2 FCM对新特征参数聚类的算法推导
  • 5.2.3 FCM对新特征参数聚类的算法步骤
  • 5.2.4 基于FVQ的说话人辨认
  • 5.2.5 局部PCA特征转换与FVQ结合的说话人辨认
  • 5.3 开集说话人阈值确认
  • 5.3.1 经典阈值
  • 5.3.2 动态阈值
  • 5.3.3 RS(Robust-Threshold)阈值
  • 5.4 聚类量化的开集说话人识别
  • 5.5 实验仿真
  • 5.5.1 聚类量化的开集说话人辨认系统的仿真实验
  • 5.5.2 聚类量化的开集说话人识别系统的仿真实验
  • 5.6 本章小结
  • 结论与展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文及科研成果
  • 相关论文文献

    • [1].极小I-开集(英文)[J]. 数学杂志 2018(03)
    • [2].关于半预开集的一个注记[J]. 成都理工大学学报(自然科学版) 2019(03)
    • [3].度量空间中开集与闭集的某些结果[J]. 绥化学院学报 2012(06)
    • [4].正则强拟开集与强拟S-闭空间[J]. 四川大学学报(自然科学版) 2014(06)
    • [5].有关θ-开集和δ-开集的一些结果[J]. 西北大学学报(自然科学版) 2011(03)
    • [6].分形几何中关于开球满足开集条件的等价结论[J]. 科教文汇(下旬刊) 2011(05)
    • [7].南开集赞网:攒能量,赞友善[J]. 中国研究生 2014(12)
    • [8].强拟准开集与强拟准连续[J]. 科技通报 2015(07)
    • [9].基于半开集的强拟开集运算与性质[J]. 吉林师范大学学报(自然科学版) 2010(02)
    • [10].一类自仿射函数迭代系统的开集条件[J]. 华中师范大学学报(自然科学版) 2012(06)
    • [11].弱β-Ⅰ-开集和弱β-Ⅰ-连续映射[J]. 山东理工大学学报(自然科学版) 2010(04)
    • [12].正则强拟开集与强拟同胚空间[J]. 四川师范大学学报(自然科学版) 2013(01)
    • [13].关于图有向自保形分形的开集条件(英文)[J]. 中国科学院大学学报 2013(04)
    • [14].层次ω-开集及其应用[J]. 数学研究 2010(04)
    • [15].一些近似开集的等价性质[J]. 五邑大学学报(自然科学版) 2008(01)
    • [16].开集人脸识别中的性能评估系统[J]. 模式识别与人工智能 2014(04)
    • [17].(α,β)-γ开集与(α,β)-γ-T_i空间(英文)[J]. 数学杂志 2015(05)
    • [18].浅议一般拓扑空间中集合之间的关系[J]. 天津农学院学报 2008(02)
    • [19].代数图递归迭代函数系与开集条件(英文)[J]. 应用数学 2014(02)
    • [20].α-拓扑空间中的开集[J]. 西南师范大学学报(自然科学版) 2014(10)
    • [21].拓扑空间子集的最小开集和最大闭集[J]. 大学数学 2011(05)
    • [22].一个例题的解和G.E.Burgess问题特解[J]. 辽宁大学学报(自然科学版) 2010(03)
    • [23].满足开集条件的自相似集的Lipschitz等价[J]. 数学年刊A辑(中文版) 2012(01)
    • [24].Fuzzy双拓扑空间中的拟开集和拟连续[J]. 内蒙古师范大学学报(自然科学汉文版) 2010(03)
    • [25].赶集[J]. 农家书屋 2015(01)
    • [26].三元素拓扑空间同胚分类[J]. 辽宁大学学报(自然科学版) 2014(03)
    • [27].试论清代中后期山西平定州的市集发展状况[J]. 沧桑 2010(08)
    • [28].基于生成对抗网络的信号调制方式的开集识别[J]. 系统工程与电子技术 2019(11)
    • [29].Clifford P-空间的一类双拓扑性质[J]. 北方工业大学学报 2010(01)
    • [30].强F_1连通的新特征[J]. 聊城大学学报(自然科学版) 2010(01)

    标签:;  ;  ;  ;  ;  

    与文本无关的开集说话人识别技术研究
    下载Doc文档

    猜你喜欢