基于MFCC和GMM的说话人识别系统研究

基于MFCC和GMM的说话人识别系统研究

论文摘要

说话人识别作为生物认证技术的一种,是根据应用语音波形中反映说话人生理和行为特征语音参数,自动鉴别说话人身份的一种技术。与其它生物识别技术相比,说话人识别具有更为简便,经济及可扩展性良好等众多优势,可广泛应用于电话银行,数据库访问,计算机远程登录,安全验证,控制等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。在众多的说话人识别技术中,本文主要研究了基于Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,简称MFCC)和高斯混合模型(Gaussian Mixture Model,简称为GMM)的说话人识别系统。 人的声道响应是反映说话人个性特征的重要的物理量。而语音信号中声道响应是和声门激励信息卷积在一起的。为了从语音信号中得到声道响应就必须对语音信号实现解卷积。本文介绍了对语音信号实现解卷积求取倒谱系数的两种方法:线性预测分析和同态分析处理。通过对语音信号进行解卷,从而获得与声道响应有关的倒谱系数,组成特征向量。 现实生活中人耳是一个比较好的说话人识别系统,而人耳对声音频率的感知却不是线性的。本文通过对人耳听觉的生理和心理特性的分析介绍,提出了利用音调特性来进行倒谱特征提取的方案,即用MEL频率对短时功率谱做频率弯折处理。在这种新的倒谱提取过程中,用符合临界带分布的等效滤波器组来模拟人耳听觉的非线性特性,从而得到了Mel频率倒谱系数(MFCC)。文中详细介绍了提取MFCC倒谱系数的理论基础和实现方案,并与传统的线性预测技术作了比较,实验结果表明这种改进后的倒谱特征提取方法比较有效。 说话人识别中有许多先进有效的识别技术,其中高斯混合模型(GMM)由于性能较好、复杂度小、方法简单,是目前最好的说话人识别算法之一。本文介绍了GMM模型的概念、模型参数的估计以及GMM的识别算法,并通过实验研究分析了GMM模型的阶数对识别性能的影响。 另外,本文还介绍了倒谱系数的动态特征,从MFCC对时间的一阶导数得到了反映倒谱动态特性的ΔMFCC。通过实验验证了动态特征(ΔMFCC)中的确含有有用的说话人个性信息。在原来MFCC倒谱系数的基础上加入ΔMFCC构成更高维的特征向量,并通过实验验证了这种组合特征对提高系统识别性能的有效性。

论文目录

  • 第一章 绪论
  • 1.1 研究背景和现状
  • 1.2 说话人识别概述
  • 1.2.1 说话人识别的概念
  • 1.2.2 说话人识别的分类
  • 1.2.3 说话人识别的基本原理和系统结构
  • 1.3 说话人识别的主要技术
  • 1.3.1 特征提取
  • 1.3.1.1 特征提取的原则
  • 1.3.1.2 常用的特征参量
  • 1.3.1.3 特征参量的评价方法
  • 1.3.2 模式匹配
  • 1.4 说话人识别系统性能的评价标准
  • 1.5 说话人识别技术的应用前景
  • 1.6 说话人识别目前研究的难点和热点
  • 1.6.1 说话人识别研究的难点
  • 1.6.2 目前说话人识别研究的热点
  • 1.7 本文的主要工作
  • 1.8 论文的结构安排
  • 第二章 语音信号的倒谱分析
  • 2.1 线性预测分析
  • 2.1.1 线性预测的基本原理
  • 2.1.2 线性预测系数的求解
  • 2.1.3 线性预测倒谱系数(LPCC)
  • 2.2 同态分析处理
  • 2.2.1 同态信号处理的原理
  • 2.2.2 复倒谱和倒谱
  • 2.2.3 复倒谱和倒谱的关系
  • 2.2.4 倒谱在语音信号解卷积中的应用
  • 2.3 本章小结
  • 第三章 MFCC倒谱系数及其提取算法
  • 3.1 人的听觉系统和语音的感知
  • 3.1.1 听觉系统的生理机制
  • 3.1.2 听觉特性
  • 3.1.3 听觉的EIH模型
  • 3.2 Mel频率简介
  • 3.3 美尔倒谱系数MFCC及其提取算法
  • 3.3.1 求取MFCC系数的具体算法和步骤
  • 3.3.2 MFCC中加入能量信息和动态参数
  • 3.3.2.1 短时归一化能量
  • 3.3.2.2 动态参数
  • 3.4 本章小结
  • 第四章 高斯混合模型
  • 4.1 GMM模型的基本概念
  • 4.2 GMM模型的参数估计
  • 4.3 GMM模型的识别算法
  • 4.4 本章小结
  • 第五章 基于MFCC和GMM的说话人辨识系统的实验和分析
  • 5.1 实验的软硬件环境
  • 5.2 实验的方案设计
  • 5.2.1 实验用的语音库
  • 5.2.2 实验的模块框图和具体参数
  • 5.3 实验结果和分析
  • 5.3.1 系统基本性能的研究
  • 5.3.2 去掉前两维特征分量的MFCC的识别率
  • 5.3.3 含能量信息的MFCC识别实验
  • 5.3.4 加入动态参数的MFCC的识别实验
  • 第六章 总结与展望
  • 参考文献
  • 发表论文
  • 致谢
  • 相关论文文献

    • [1].我国税收优惠对集成电路企业发展的效应分析——基于动态面板广义矩(GMM)估计[J]. 税务研究 2020(02)
    • [2].基于GMM托肯配比相似度校正得分的说话人识别[J]. 清华大学学报(自然科学版) 2017(01)
    • [3].金融集聚、人力资本与经济增长——基于省际动态面板数据差分GMM分析[J]. 山东工商学院学报 2017(01)
    • [4].制造业企业特征、融资约束和研发支出——基于系统GMM动态面板的估计[J]. 财会通讯 2017(15)
    • [5].一种基于GMM和多项式拟合的语音编码改进算法[J]. 南京师范大学学报(工程技术版) 2017(02)
    • [6].对外贸易对城市人口规模的影响——基于我国百个地级市的系统GMM研究[J]. 国际商务(对外经济贸易大学学报) 2016(02)
    • [7].人力资本增长对我国工业资本回报率提升的影响——基于地区与行业视角的GMM方法[J]. 软科学 2016(05)
    • [8].价值链低端生产是否限制了中国的资本回报率——基于省级动态面板数据GMM方法[J]. 国际贸易问题 2015(06)
    • [9].我国人口出生率及其影响因素研究——基于动态GMM模型和门限模型的实证分析[J]. 价格理论与实践 2019(11)
    • [10].基于GMM改进的信息系统安全态势实时预测研究[J]. 计算机应用与软件 2017(02)
    • [11].财政政策对产业结构优化的影响——基于我国省级面板数据的系统GMM分析[J]. 公共财政研究 2017(03)
    • [12].信息化影响新型城镇化的经验估计与机制分析——基于GMM动态面板模型[J]. 经济与社会发展 2017(03)
    • [13].基于系统GMM的国防支出与政府债务关系研究[J]. 天津大学学报(社会科学版) 2015(02)
    • [14].加速折旧促进制造业投资研究——基于GMM估算的实证分析[J]. 会计之友 2015(15)
    • [15].政府规模对经济增长影响效应的GMM评价——基于市级面板数据的实证分析[J]. 北京工业大学学报(社会科学版) 2015(05)
    • [16].综合经营、专业化与健康保险业务发展——基于系统GMM估计的动态面板模型分析[J]. 保险研究 2014(03)
    • [17].基于GMM的说话人识别系统设计与实现[J]. 微处理机 2014(03)
    • [18].新经济地理视角下产业集聚对税收竞争的影响——基于GMM估计的省级动态面板数据分析[J]. 生产力研究 2014(06)
    • [19].金融发展、融资约束与环保投资——基于中国省级面板数据的GMM检验[J]. 现代经济信息 2014(20)
    • [20].地方政府腐败会影响私人投资积极性吗?——基于动态面板模型的系统GMM分析[J]. 南方经济 2012(02)
    • [21].基于GMM的黄瓜病害图像建模[J]. 安徽农业科学 2011(34)
    • [22].城市水价预测长期边际成本模型的GMM参数估计[J]. 自然资源学报 2010(09)
    • [23].基于聚类优化GMM提高说话人识别性能的研究[J]. 计算机技术与发展 2009(04)
    • [24].基于GMM的说话人识别研究与实践[J]. 计算机与数字工程 2009(06)
    • [25].利率期限结构模型估计中的GMM方法述评[J]. 统计与决策 2008(09)
    • [26].产业结构变化背景下创业对经济增长的影响——基于2000—2015年省际面板数据的GMM分析[J]. 湖北经济学院学报(人文社会科学版) 2019(10)
    • [27].东道国基础设施水平对我国对外直接投资的影响——基于“一带一路”国家的系统GMM研究[J]. 对外经贸 2017(03)
    • [28].基于多特征融合GMM的阴影检测策略研究[J]. 河北工业科技 2014(05)
    • [29].中国空气污染库兹涅茨曲线的实证研究——基于动态面板系统GMM与门限模型检验[J]. 经济问题 2014(04)
    • [30].基于GMM的说话人识别[J]. 广西物理 2011(01)

    标签:;  ;  ;  ;  

    基于MFCC和GMM的说话人识别系统研究
    下载Doc文档

    猜你喜欢