基于支持向量数据描述的说话人识别研究

基于支持向量数据描述的说话人识别研究

论文摘要

说话人识别技术由于其独特的便利性、精确性和经济性,被认为是最自然的生物认证技术,在安全监控、司法鉴定、电子侦听、金融服务等方面都具有广泛的应用前景。当前,说话人识别系统开发已逐渐从理论研究转向实际应用,对其要求也随着应用环境的变化而越来越高,不仅期望具有极高的识别率,还要具有较高的实时性。此外,系统构建的便捷性、模型扩展能力等都不容忽视。近十几年来,基于核函数的分类算法已成为模式识别领域的研究焦点,它有效克服了传统模式识别方法中局部极小和非完全统计分析的缺点,具有很强的非线性处理能力,而说话人识别系统中输入的语音特征参数正好是非线性的且局部特性复杂。因此,本文提出密度诱导型数据描述单类分类机,将其应用于说话人识别时能够获得很好的效果。本文以小样本语料库为应用对象,针对说话人识别中的辨认任务,提出了具有较好的核分类方法。主要工作如下:(1)详细介绍说话人识别中应用最为广泛的两类特征参数LPCC和MFCC以及他们的提取过程和方法。(2)介绍了支持向量机的基本理论。经典的支持向量机只支持二元分类的情况,我们借助“一对一”或“一对多”技术对其进行多元扩展并应用于说话人识别(3)将支持向量数据描述(SVDD)应用于说话人识别,SVDD在训练过程中只需单类样本,可以胜任多分类任务。为适应开集辨认任务提出了密度诱导型数据描述单类分类机(DISVDD),此算法以支持向量域描述(SVDD)算法为基础,通过一种简易的形式引入数据间密度因子,使处于不同区域的数据对分类器的作用不再被同等对待,高密度区数据对分类支撑域的作用被强化,而低密区即呈零星分布的数据作用被削弱,结果使分类超球体自动靠近数据高密区而提高其识别性能。说话人辨认实验结果表明,DISVDD模型的识别性能全面优于GMM。(4)针对越来越多的场合需要利用生物识别技术来提高信息的安全性,本文将DISVDD应用于声纹锁中,使用该算法可以在一定程度上提升系统的实时性及准确率。(5)最后,对本文工作进行了总结,并对声纹识别系统的进一步研究进行了展望。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.2 说话人识别系统框架
  • 1.2.1 语音信号预处理
  • 1.2.2 特征参数提取
  • 1.2.3 识别模型
  • 1.2.4 得分判决
  • 1.3 国内外研究现状
  • 1.4 研究内容与结构安排
  • 1.4.1 论文内容概述
  • 1.4.2 论文组织结构
  • 第2章 语音信号特征参数
  • 2.1 预处理流程
  • 2.2 特征参数LPCC 的提取
  • 2.3 特征参数MFCC 的提取
  • 2.4 本章小结
  • 第3章 支持向量机理论
  • 3.1 统计学习理论
  • 3.1.1 学习过程一致性的条件
  • 3.1.2 VC 维
  • 3.1.3 推广性的界
  • 3.1.4 结构风险最小化
  • 3.2 支持向量机
  • 3.2.1 支持向量机模型
  • 3.2.2 核分类思想
  • 3.3 SVM 说话人识别
  • 3.3.1 SVM 说话人确认
  • 3.3.2 SVM 说话人辨认
  • 3.4 本章小结
  • 第4章 密度诱导型数据描述单类分类机
  • 4.1 引言
  • 4.2 支持向量数据描述
  • 4.2.1 线性SVDD
  • 4.2.2 核化SVDD
  • 4.3 密度诱导型数据域描述分类机
  • 4.4 实验
  • 4.4.1 数据描述性能对比
  • 4.4.2 公共数据集识别实验
  • 4.4.3 说话人辨认实验
  • 4.5 本章小结
  • 第5章 说话人识别在声纹锁中的应用
  • 5.1 概述
  • 5.2 生物识别的分类
  • 5.3 硬件设计
  • 5.3.1 系统结构
  • 5.3.2 识别流程
  • 5.4 本章小结
  • 第6章 结论与展望
  • 6.1 结论
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间参加的科研项目和成果
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  

    基于支持向量数据描述的说话人识别研究
    下载Doc文档

    猜你喜欢