说话人识别算法研究与说话人辨认系统实现

说话人识别算法研究与说话人辨认系统实现

论文摘要

说话人识别是最自然的生物特征身份鉴定方式,可分为说话人辨认和说话人确认。说话人识别根据包含在语音信号中的个性特征来自动识别说话人,其关键问题是特征参数选择与识别模型建立。目前,说话人识别的常用特征参数有线性预测编码(LPC)参数、LPC倒谱(LPCC)和美尔倒谱系数(MFCC)等,常用的识别模型有动态时间规整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)等。LPCC反映了说话人声道生理结构的差异,而MFCC则利用了听觉频率非线性特性,反映了人对语音的感知特性。希尔伯特-黄变换(HHT)自1998年提出,由于其处理时变、非稳态系统信号的较强的自适应能力,已得到了较广泛的关注和获得了许多成功的应用,目前也是语音信号处理的最新研究手段。这些特征参数各有其优势,但单独都不能充分描述说话人的个性特征,一般主要包含语义信息,也可能包含说话人的某些特征,综合利用方可使系统性能可靠。有鉴于此,在说话人识别系统中首先分别使用LPCC、MFCC和HHT提取出的参数作为特征参数,然后将MFCC与基于HHT提取出的特征参数有机地构成混合参数。本文采用Matlab工具试验比较了LPCC、MFCC、基于HHT提取出的特征参数、混合参数分别与DTW、DHMM(离散马尔可夫模型)、GMM(高斯混合模型)相结合的识别效果。接着,测试了GMM中高斯分量的选择对识别性能的影响。实验结果显示,对于说话人辨认,基于HHT提取出的特征参数有较好的识别率,基于混合参数和GMM相结合的识别率高于基于混合参数和DTW或DHMM相结合的识别率,并且混合参数明显优于单一的参数的性能。试验证明了基于HHT提取出的特征参数作为一种新的特征参数可以应用于说话人识别,将其与MFCC参数相结合构成混合参数,既利用MFCC能够较好地描述动态时间序列又利用HHT频率分辨能力强的特点,将该混合参数应用于说话人辨认系统,提高了系统的性能。对于说话人辨认系统,识别模型选择GMM,系统的识别性能是最优的,即识别率最好,训练时间较短。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 说话人识别概述
  • 1.1.1 说话人识别的基本概念及原理
  • 1.1.2 研究目的及意义
  • 1.2 说话人识别的历史及国内外研究现状
  • 1.3 说话人识别的主要应用及前景
  • 1.4 说话人识别的研究方法
  • 1.5 本文的主要工作
  • 第2章 语音信号的Hilbert-Huang 变换
  • 2.1 Hilbert-Huang 变换的基本原理和方法
  • 2.1.1 经验模态分解(EMD)分解
  • 2.1.2 希尔伯特(Hilbert)变换
  • 2.2 语音信号的Hilbert-Huang 变换
  • 2.3 基于HHT 的语音特征参数的优缺点
  • 2.4 本章小结
  • 第3章 语音信号的预处理与特征提取
  • 3.1 语音信号的预处理
  • 3.1.1 端点检测
  • 3.1.2 预加重
  • 3.1.3 分帧和加窗
  • 3.2 特征提取
  • 3.2.1 LPCC 系数及其差分参数提取
  • 3.2.2 MFCC 系数及其差分参数提取
  • 3.2.3 基于HHT 变换的特征系数提取
  • 3.2.4 特征参数的比较
  • 3.3 本章小节
  • 第4章 说话人识别模型
  • 4.1 说话人识别的主要方法
  • 4.2 DTW 模型
  • 4.2.1 DTW 的基本概念
  • 4.2.2 DTW 模型的识别算法
  • 4.2.3 DTW 的优缺点
  • 4.3 HMM 模型
  • 4.3.1 HMM 的基本概念及原理
  • 4.3.2 HMM 模型的识别算法
  • 4.3.3 HMM 的优缺点
  • 4.4 GMM 模型
  • 4.4.1 GMM 的基本概念
  • 4.4.2 GMM 模型的识别算法
  • 4.4.3 GMM 的优缺点
  • 4.5 本章小结
  • 第5章 说话人辨认系统设计与实现
  • 5.1 语音数据库
  • 5.2 说话人辨认系统的实现
  • 5.3 实验数据分析及性能评价
  • 5.4 本章小结
  • 第6章 结论与展望
  • 6.1 结论
  • 6.2 课题展望
  • 参考文献
  • 攻读硕士期间发表的论文目录
  • 致谢
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  

    说话人识别算法研究与说话人辨认系统实现
    下载Doc文档

    猜你喜欢