基于MFCC和矢量量化的说话人识别算法研究

基于MFCC和矢量量化的说话人识别算法研究

论文摘要

说话人识别技术是根据语音波形中反映说话人生理特征差异和行为习惯差异的语音参数能够自动鉴别说话人是谁的一项技术,其广泛的应用前景正受到越来越多人的重视。本文主要是基于美尔频率倒谱系数(Mel Frequency CepstralCoefficients,MFCC)和矢量量化的与文本无关说话人识别技术的研究,采用矢量量化和自适应蚁群算法混合的方法,参数利用改进窗函数的Bark子波的美尔频率倒谱系数。首先,在MFCC特征提取的预处理阶段对窗函数进行改进,用改进的Lanczos窗代替汉明窗,在确定主瓣的宽度基本一致的情况下,使旁瓣能更好的得到抑制,并引入与人耳听觉系统更为适应的Bark子波变换,其基函数满足时间-感知频率上的最佳不确定性,分析尺度的伸缩则按照“临界带(Critical Band)”的中心频率来变化,将其应用于MFCC特征提取过程中,能提高语音在噪声环境下的鲁棒性。然后,对矢量量化模式识别方法进行改进,针对LBG算法极易陷入局部最优解的可能性和依赖初始码本的选择问题,利用蚁群算法的分布式并行机制,将蚁群算法与LBG算法进行混合交替,在提高其全局搜索能力的同时,通过LBG算法加快收敛速度。为了防止蚁群算法也陷入局部最优解的可能,采取了确定性选择和随机性选择相结合的选择策略,在搜索过程中动态调整状态转移概率的方法,从一定程度上防止了所得的结果是局部最优解。最后,一种基于标准差描述的加权欧式距离测度用于匹配判决。通过实验可以验证,改进后的特征提取算法以及混合蚁群算法的矢量量化识别方法,与传统的基准算法相比较,识别率和鲁棒性均得到提高,且随着训练语音长度的增加,识别效果更好。因此在实际应用中,需要根据具体的环境进行调整。

论文目录

  • 摘要
  • Abstract
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 说话人识别研究目的与意义
  • 1.2 国内外研究现状
  • 1.3 说话人识别的技术难点
  • 1.4 论文的主要内容和结构安排
  • 1.4.1 论文的主要内容
  • 1.4.2 论文的结构安排
  • 第2章 说话人识别概述
  • 2.1 语音的特点和发声原理
  • 2.1.1 语音的特点
  • 2.1.2 语音的发声原理
  • 2.2 说话人识别的基本理论
  • 2.2.1 语音信号的数字化和预处理
  • 2.2.2 说话人识别特征参数的选取
  • 2.2.3 说话人识别方法
  • 2.3 说话人识别的性能评价
  • 2.4 小结
  • 第3章 基于MFCC特征提取的改进算法
  • 3.1 Mel频率尺度倒谱系数MFCC
  • 3.1.1 Mel频率
  • 3.1.2 MFCC特征提取流程
  • 3.2 各种窗函数性能的研究
  • 3.2.1 各种基本窗函数的性能比较
  • 3.2.2 窗函数的改进
  • 3.3 Bark子波的研究
  • 3.3.1 掩蔽效应
  • 3.3.2 Bark子波及其变换
  • 3.4 基于改进窗的Bark子波的MFCC特征提取方法
  • 3.5 小结
  • 第4章 基于自适应蚁群算法的VQ识别方法
  • 4.1 矢量量化技术介绍
  • 4.1.1 矢量量化的基本原理
  • 4.1.2 矢量量化的失真测度
  • 4.2 矢量量化器的码本设计
  • 4.2.1 LBG算法
  • 4.2.2 初始码本的生成
  • 4.2.3 LBG算法的改进
  • 4.3 蚁群算法介绍
  • 4.3.1 蚁群算法的产生
  • 4.3.2 基本蚁群算法
  • 4.3.3 自适应蚁群算法
  • 4.4 混合自适应蚁群算法的VQ码本设计算法
  • 4.4.1 基本蚁群算法的码本设计算法实现
  • 4.4.2 混合蚁群算法的VQ码本设计算法
  • 4.5 小结
  • 第5章 算法实现和实验结果
  • 5.1 语音数据的采集和预处理
  • 5.1.1 语音数据的采集
  • 5.1.2 语音数据的预处理
  • 5.2 实验及结果分析
  • 5.2.1 实验一码本尺寸对识别结果的影响
  • 5.2.2 实验二测试长度对识别结果的影响
  • 5.2.3 实验三改进特征参数对识别结果的影响
  • 5.2.4 实验四不同识别方法对识别结果的影响
  • 5.3 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录A 攻读学位期间所发表的学术论文及参加的科研项目
  • 相关论文文献

    • [1].改进的多窗谱MFCC在说话人确认中的应用[J]. 计算机系统应用 2014(11)
    • [2].基于音频特征MFCC的混合域脆弱水印算法[J]. 计算机工程与设计 2017(07)
    • [3].娱乐且公益首届“MFCC”公益微电影受追捧[J]. 社会与公益 2013(12)
    • [4].说话人识别中MFCC参数提取的改进[J]. 计算机工程与应用 2014(07)
    • [5].基于小波包变换和MFCC的说话人识别特征参数[J]. 电声技术 2009(02)
    • [6].MFCC中的基音频率信息对说话人识别系统性能的影响[J]. 中国科学技术大学学报 2009(08)
    • [7].基于修正MFCC的耳语说话人识别方法[J]. 苏州大学学报(工科版) 2009(04)
    • [8].声纹识别特征MFCC的提取方法研究[J]. 中国人民公安大学学报(自然科学版) 2008(01)
    • [9].基于MFCC特征组合参数的说话人识别研究[J]. 集美大学学报(自然科学版) 2016(04)
    • [10].说话人识别系统中MFCC参数的改进算法[J]. 洛阳理工学院学报(自然科学版) 2013(04)
    • [11].用于说话人识别的MFCC的改进算法[J]. 电子测量技术 2009(08)
    • [12].基于MFCC的语音情感识别[J]. 重庆邮电大学学报(自然科学版) 2008(05)
    • [13].一种基于MFCC与韵律特征的说话人确认方法[J]. 杭州电子科技大学学报 2013(05)
    • [14].基于样本熵与MFCC融合的语音情感识别[J]. 计算机工程 2012(07)
    • [15].MFCC-小波神经网络电气主设备音频监控研究[J]. 电力与能源 2019(06)
    • [16].说话人识别中改进的MFCC参数提取方法[J]. 科学技术与工程 2011(18)
    • [17].基于MFCC与神经网络的小蠹声音种类自动鉴别[J]. 北京林业大学学报 2011(05)
    • [18].基于MFCC等组合特征的说话人识别模型[J]. 三峡大学学报(自然科学版) 2009(06)
    • [19].基于MFCC倒谱距离的语音端点检测方法[J]. 信息通信 2015(07)
    • [20].基于MFCC相似度和谱熵的端点检测算法[J]. 现代电子技术 2013(21)
    • [21].基于时频分布与MFCC的说话人识别[J]. 计算机系统应用 2012(04)
    • [22].基于改进MFCC和短时能量的咳嗽音身份识别[J]. 计算机技术与发展 2012(06)
    • [23].新型MFCC和波动模型相结合的二层环境声音识别[J]. 计算机工程与应用 2011(30)
    • [24].基于MFCC倒谱距离与对数的语音端点检测方法[J]. 电声技术 2016(09)
    • [25].基于MFCC和短时能量混合的异常声音识别算法[J]. 计算机应用 2010(03)
    • [26].基于改进MFCC的异常声音识别算法[J]. 重庆工商大学学报(自然科学版) 2012(02)
    • [27].语音MFCC特征提取的FPGA实现[J]. 计算机工程与设计 2008(21)
    • [28].改进的混合MFCC语音识别算法研究[J]. 计算机工程与应用 2009(33)
    • [29].小波分析和MFCC融合的声音信号端点检测算法[J]. 电子测量技术 2016(07)
    • [30].基于用小波变换改进MFCC的语句识别方法[J]. 科技信息(科学教研) 2008(14)

    标签:;  ;  ;  ;  

    基于MFCC和矢量量化的说话人识别算法研究
    下载Doc文档

    猜你喜欢