基于支持相量机的稳键说话人识别

基于支持相量机的稳键说话人识别

论文摘要

说话人识别属于生物识别的一种,是指从说话人的一段语音中提取出说话人的个性特征,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或确认的目的。它被认为是最自然的生物特征识别身份鉴定方式。由于语音是个人所固有的特征,人的语音可以非常自然的产生,训练和识别时并不需要特别的输入设备,诸如个人电脑普遍配置的话筒和到处都有的电话都可以作为输入设备,因此说话人识别系统的价格也较低,上述原因促使语音成为人们愿意接受的一种生物特征。尽管目前说话人识别技术已经取得了相当大的进展,但是将说话人识别技术大规模的应用到实际还有很多问题有待于解决,是当前生物特征识别领域研究的热点。本文研究了基于支持向量机的说话人识别,通过理论分析和实验结果得知,基于SVM的说话人识别虽然可以取得比较好的效果,但当数据规模增大时,识别效率下降比较快,缺少对大规模数据的处理能力。为了弥补基于SVM的说话人识别的这个缺点,本文对基于GMM的说话人识别进行了研究,提出基于SVM+GMM的说话人识别方法,将两种识别方法的优点进行了结合。实验结果表明,该方法可以取得比其它两种方法都好的识别性能,并且它既有处理大规模数据的能力又可以在训练样本不足的情况下得到较高的识别率。本文在研究了双分界面的支持向量机这种新的分类器模型后,提出了将TWSVM模型应用于说话人识别的方法,并采用一种新的结合方式将其与GMM模型结合起来,从而得到基于TWSVM+GMM的说话人识别方法体系。该方法是使用GMM模型进行特征提取,将得到的特征参数作为输入进行TWSVM模型的训练。实验结果表明,基于TWSVM+GMM的说话人识别方法在识别效率上已经超过了传统的SVM方法,并且比它具有更好的大规模数据处理能力。在训练样本充足的情况下也已经接近于基于GMM模型的方法。根据本文提出的说话人识别算法,设计实现了基于支持向量机的说话人识别系统,本文对该系统的设计框架、系统实现、系统性能等作了详细的介绍。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 说话人识别概述
  • 1.2 说话人识别相关技术
  • 1.2.1 语音信号的预处理
  • 1.2.2 说话人特征参数提取
  • 1.2.3 说话人识别的主要方法
  • 1.3 研究意义
  • 1.3.1 实际应用意义
  • 1.3.2 国内外研究状况
  • 1.3.3 目前存在的问题
  • 1.4 主要研究任务及内容组织
  • 1.4.1 课题研究任务
  • 1.4.2 内容组织
  • 第二章 基于支持向量机的说话人识别
  • 2.1 引言
  • 2.2 支持向量机模型
  • 2.2.1 统计学习理论
  • 2.2.2 支持向量机
  • 2.2.3 SVM 的训练算法
  • 2.3 基于支持向量机的说话人识别的实现
  • 2.4 基于支持向量机的说话人识别实验与分析
  • 2.4.1 实验的软硬件环境
  • 2.4.2 实验的方案设计
  • 2.4.3 实验结果和分析
  • 2.5 本章小结
  • 第三章 基于SVM+GMM 的说话人识别
  • 3.1 引言
  • 3.2 基于GMM 的说话人识别研究
  • 3.2.1 GMM 模型概述
  • 3.2.2 GMM 模型的参数估计
  • 3.2.3 基于GMM 的说话人识别的实现与分析
  • 3.3 基于SVM+GMM 的说话人识别算法
  • 3.4 基于SVM+GMM 的说话人识别实验与分析
  • 3.4.1 实验的软硬件环境
  • 3.4.2 实验的方案设计
  • 3.4.3 实验结果和分析
  • 3.5 本章小结
  • 第四章 基于TWSVM+GMM 的说话人识别
  • 4.1 引言
  • 4.2 TWSVM 模型
  • 4.2.1 线性TWSVM 模型
  • 4.2.2 非线性TWSVM 模型
  • 4.2.3 TWSVM 模型与SVM 模型的比较
  • 4.3 基于TWSVM+GMM 的说话人识别算法
  • 4.3.1 基于GMM 的特征提取
  • 4.3.2 基于TWSVM 的模型训练
  • 4.3.3 算法流程
  • 4.4 基于TWSVM+GMM 的说话人识别实验与分析
  • 4.4.1 实验的软硬件环境
  • 4.4.2 实验的方案设计
  • 4.4.3 实验结果和分析
  • 4.5 本章小结
  • 第五章 说话人识别系统
  • 5.1 系统概述
  • 5.2 系统功能特点
  • 5.3 系统设计
  • 5.3.1 系统需求分析
  • 5.3.2 系统模块
  • 5.4 系统实现
  • 5.4.1 程序设计
  • 5.4.2 界面设计
  • 5.5 系统评价
  • 5.6 本章小结
  • 第六章 结论与展望
  • 6.1 结论
  • 6.2 展望
  • 致谢
  • 参考文献
  • 个人简介和攻读硕士期间的成果
  • 相关论文文献

    • [1].基于说话人的音频分割与聚类[J]. 心智与计算 2010(02)
    • [2].基于变分贝叶斯改进的说话人聚类算法[J]. 数据采集与处理 2017(01)
    • [3].基于说话人辨识的自上而下听觉显著性注意模型[J]. 计算机系统应用 2017(07)
    • [4].说话人用意的认知加工机制:基于误解分析的证据[J]. 外语教学 2016(04)
    • [5].“权威度”视角下终助词「ね」的附加考察[J]. 散文百家(理论) 2020(09)
    • [6].润泽有效的课堂,从引导学生学会倾听开始[J]. 快乐阅读 2016(24)
    • [7].那些有故事的“说话人”[J]. 长江丛刊 2017(01)
    • [8].汉日位移动词比较研究[J]. 唐山文学 2017(02)
    • [9].简约而不简单的英语实用口语[J]. 初中生辅导 2016(36)
    • [10].临时性词汇及其语用功能探析[J]. 青年文学家 2017(09)
    • [11].说话人意义的形成机制及其功能——“语言与人”系列研究(1)[J]. 外语学刊 2013(06)
    • [12].论词层级上说话人意义的形成因素[J]. 外语教学 2013(06)
    • [13].基于卷积长短期记忆网络的说话人辨识[J]. 信息通信 2020(08)
    • [14].说话人聚类的初始类生成方法[J]. 计算机工程与应用 2017(03)
    • [15].说话人视角下“来”的参照点问题再认识[J]. 语言教学与研究 2017(02)
    • [16].基于改进的深度神经网络的说话人辨认研究[J]. 电子器件 2017(05)
    • [17].基于语速差异的新闻发布会中首要说话人检测[J]. 计算机工程与应用 2015(04)
    • [18].一种多说话人角色聚类方法[J]. 华南理工大学学报(自然科学版) 2015(01)
    • [19].基于深层说话人矢量的说话人检索[J]. 华中科技大学学报(自然科学版) 2015(07)
    • [20].论说话人交际策略选择的影响因素[J]. 青年文学家 2014(27)
    • [21].汉语语音合成中说话人自适应的时长优化[J]. 清华大学学报(自然科学版) 2013(11)
    • [22].基于话者无关模型的说话人转换方法[J]. 模式识别与人工智能 2013(03)
    • [23].基于辨别性深度信念网络的说话人分割[J]. 清华大学学报(自然科学版) 2013(06)
    • [24].说话人分割聚类研究进展[J]. 信号处理 2013(09)
    • [25].新闻故事中的关键说话人发现方法[J]. 计算机工程与设计 2012(06)
    • [26].一种基于性别的说话人索引算法[J]. 计算机工程与科学 2012(06)
    • [27].基于NIST评测的说话人分类及定位技术研究[J]. 电子与信息学报 2011(05)
    • [28].说话人意义及其结构的研究维度——语言主观意义研究(一)[J]. 外语教学 2011(05)
    • [29].反讽话语说话人的意向及其常规推理[J]. 河北理工大学学报(社会科学版) 2010(02)
    • [30].用于说话人辨识的评分规整[J]. 计算机工程与应用 2010(12)

    标签:;  ;  ;  ;  

    基于支持相量机的稳键说话人识别
    下载Doc文档

    猜你喜欢