基于NPC和改进的MFCC鲁棒语音特征提取研究

基于NPC和改进的MFCC鲁棒语音特征提取研究

论文摘要

语音识别在实验室环境中已取得了令人满意的效果,但当运用到实际环境时却往往出现识别率显著下降的情况,如何提高噪声环境下的语音识别鲁棒性是当今语音识别研究中最为重要的问题。本文针对语音识别前端处理中的鲁棒性语音特征提取技术展开研究,分别从时域和频域两个方面出发,并结合人类发声特点和人耳听觉特性对已有的特征进行改进,提出了两种具有较好鲁棒性的语音特征提取方法。首先,本文提出采用神经网络进行非线性预测的时域特征提取方法,针对神经网络预测存在大量待估计参数的问题,通过线性预测方法中的最小均方误差原理,减少了估计参数的数目,实现了鲁棒性较高的特征提取。实验表明,在多种信噪比下,与线性预测编码系数(Linear Predictive Coding, LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征相比有更好的鲁棒性。其次,针对传统MFCC的离散余弦变换(Discrete Cosine Transform,DCT)在语音信息表达方面存在的缺陷,采用具有更好表征能力的独立成分分析法(Independent Component Analysis,ICA)对离散余弦变换进行替换,提出了一种新的特征提取方法。实验表明,新的提取方法显著增强了改进后特征对语音特性的表达能力,在相同信噪比下比传统MFCC特征具有更好的鲁棒性;同时,为减少识别中出现的插入错误,引入了Hermansky提出的相对谱滤波技术,实验结果表明,与传统MFCC及ICA改进的MFCC相比,结合相对谱滤波技术的新方法显著减少了插入错误,且保持较高的词识别率;与传统感知线性预测(PerceptualLinear Predictive,PLP)及相对谱滤波改进的PLP相比,词识别率提升很多且去除插入错误的词识别率相差很小。

论文目录

  • 摘要
  • Abstract
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 选题背景及研究意义
  • 1.2 特征提取的国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 主要内容及结构安排
  • 1.3.1 主要内容
  • 1.3.2 文章结构
  • 第2章 语音特征提取综述
  • 2.1 基于发声系统的特征提取
  • 2.1.1 线性预测编码系数
  • 2.2 基于听觉效应的特征提取
  • 2.2.1 梅尔频率倒谱系数
  • 2.2.2 感知线性预测系数
  • 2.3 实验测试平台
  • 2.3.1 实验软硬件条件
  • 2.3.2 语音特征测评平台搭建
  • 2.4 小结
  • 第3章 基于非线性预测的语音特征提取
  • 3.1 人工神经网络的基础
  • 3.1.1 BP 神经网络原理
  • 3.1.2 BP 神经网络的缺陷
  • 3.2 基于 BP 神经网络的 NPC 特征提取
  • 3.2.1 线性预测模型的缺陷
  • 3.2.2 基于神经网络的非线性预测
  • 3.2.3 NPC 模型结构
  • 3.2.4 NPC 特征提取过程
  • 3.3 实验方案与结果分析
  • 3.3.1 NPC 特征提取实现方案
  • 3.3.2 NPC 特征的鲁棒性评测
  • 3.4 NPC 特征的特点
  • 3.5 小结
  • 第4章 基于 ICA 改进 MFCC 的特征提取
  • 4.1 ICA 基础知识
  • 4.1.1 ICA 的严格数学定义
  • 4.1.2 ICA 存在的问题
  • 4.1.3 ICA 模型中的独立
  • 4.1.4 ICA 估计原理
  • 4.1.5 非高斯性度量函数
  • 4.2 FastICA 方法估计 ICA 模型
  • 4.2.1 FastICA 算法的预处理
  • 4.2.2 FastICA 算法的后处理
  • 4.2.3 FastICA 算法
  • 4.3 FastICA 算法改进 MFCC 特征
  • 4.3.1 传统 MFCC 的缺陷
  • 4.3.2 FastICA 算法带来的问题
  • 4.3.3 统一解混矩阵的 ICA 变换
  • 4.3.4 对数能量和特征差分补充特征
  • 4.3.5 相对谱滤波技术
  • 4.3.6 ICA 特征提取过程
  • 4.4 实验方案与结果分析
  • 4.4.1 ICA 特征提取方案
  • 4.4.2 ICA 改进 MFCC 的鲁棒性评测
  • 4.5 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录 A (攻读学位期间发表的学术论文)
  • 附录 B (攻读学位期间参与的科研项目)
  • 相关论文文献

    • [1].菲式英语下层方言的语音特征:宿雾籍英语使用者个案研究[J]. 校园英语 2017(24)
    • [2].云南建水汉语方言的儿化[J]. 汉藏语学报 2016(00)
    • [3].汉语和韩语的语音特征[J]. 学园 2017(08)
    • [4].酒类广告语的语音特征[J]. 鸭绿江(下半月版) 2015(03)
    • [5].多类型语音特征进化选择算法[J]. 计算机工程与应用 2016(14)
    • [6].从语音特征出发设计语音教学[J]. 学术研究 2015(03)
    • [7].不同录音环境对语音特征的影响研究[J]. 中国人民公安大学学报(自然科学版) 2018(04)
    • [8].从历史文献看宋代四川方言[J]. 四川大学学报(哲学社会科学版) 2008(02)
    • [9].改进的语音特征提取方法及其应用[J]. 计算机工程 2008(05)
    • [10].基于语音特征比较的蒙古语标准音测试系统研究[J]. 内蒙古大学学报(自然科学版) 2008(04)
    • [11].多噪声环境下声音的身份鉴定技术研究与仿真[J]. 计算机仿真 2012(05)
    • [12].基于电网频率信号的语音特征提取研究[J]. 信息技术与信息化 2020(08)
    • [13].语音特征增强方法综述[J]. 哈尔滨理工大学学报 2014(02)
    • [14].基于语音特征的情感分类[J]. 小型微型计算机系统 2016(02)
    • [15].从英语和拉祜语语音特征看语言与思维的关系[J]. 科教文汇(上旬刊) 2009(08)
    • [16].基于小波包变换和小波阈值消噪的语音特征提取[J]. 机电工程 2008(09)
    • [17].户语语音特征及其构词方式[J]. 黔南民族师范学院学报 2018(05)
    • [18].兵团汉语方言的语音特征及差异[J]. 忻州师范学院学报 2018(04)
    • [19].人体语音特征提取身份优化验证仿真研究[J]. 计算机仿真 2017(02)
    • [20].基于声门特征与语音特征的语音情感识别对比研究[J]. 电声技术 2020(05)
    • [21].基于随机森林算法的语音特征智能辨识[J]. 电脑与电信 2019(10)
    • [22].基于改进语音特征提取方法的语音识别[J]. 微电子学与计算机 2009(07)
    • [23].模拟航天环境对发音人语音特征的影响[J]. 航天医学与医学工程 2010(02)
    • [24].西南官话武昆片语音特征的形成原因探究[J]. 文山学院学报 2018(02)
    • [25].基于小波变换的鲁棒性语音特征提取新方法[J]. 计算机仿真 2010(08)
    • [26].“一带一路”沿线11国英语变体的语音特征分析[J]. 内蒙古农业大学学报(社会科学版) 2019(03)
    • [27].东北官话几类特殊的语音特征及其侦查学价值[J]. 吉林公安高等专科学校学报 2012(02)
    • [28].基于改进KPCA的语音特征提取方法[J]. 计算机仿真 2011(06)
    • [29].TD-SCDMA网络单通故障的实时监测方法[J]. 电信工程技术与标准化 2011(03)
    • [30].基于动态范围调整语音特征调整算法分析[J]. 电子制作 2013(15)

    标签:;  ;  ;  ;  ;  

    基于NPC和改进的MFCC鲁棒语音特征提取研究
    下载Doc文档

    猜你喜欢