非特定人鲁棒性语音识别中前端滤波器的研究

非特定人鲁棒性语音识别中前端滤波器的研究

论文摘要

非特定人语音识别在于净环境下识别性能良好,但在噪声情况下,其系统性能将会大大下降。不仅如此,其识别率还受到语音多变性的影响,使识别的难度加大。本文针对非特定人识别系统中的噪音鲁棒性和多变性鲁棒性问题,对在特征提取时起重要作用的前端滤波器进行研究。分别从听觉感知和语音信号本身这两个角度出发来设计滤波器,使得滤波器更符合人耳听觉特性,或更精确地分析待识别的语音信号。抗噪实验表明,随着滤波器性能的不断提高,对应提取特征的噪音鲁棒性逐渐提高,不仅如此,多变性鲁棒性的实验表明,滤波器性能的提高与多变性鲁棒性的提高是一致的。本文主要完成了如下工作:(1)在FIR滤波器设计的基础上,给出Laguerre滤波器设计的详细步骤,并用后者代替前者用于过零峰值幅度(Zero Crossing Peak Amplitude, ZCPA)特征的提取。给出频域法实现Laguerre滤波器提取ZCPA特征的详细过程。Laguerre滤波器具有FIR滤波器的线性相位和ⅡR滤波器的长时记忆性,弥补了FIR滤波器通阻带特性差的缺点。实验表明,精确设计每一通道的中心频率和带宽得到的Laguerre滤波器较FIR滤波器明显提高了噪音鲁棒性。(2)针对FIR, Laguerre滤波器带宽呈对称性分布,不符合人耳听觉特性这一缺点,设计实现了弯折滤波器组(Warped Filter Banks, WFBs),并将其应用于ZCPA特征提取。通过一阶全通函数中的弯折因子p控制滤波器中心频率和带宽的分布,从而得到非均匀的频带分布和非对称性的带宽分布。典型的弯折因子p=0.48,p=0.63分别对应Bark, ERB尺度滤波器。同FIR, Laguerre滤波器相比,WFBs不需要严格控制每一通道的中心频率和带宽,而是同时得到16个通道的频率响应。实验表明,非均匀分布的频带和非对称分布的带宽较均匀分布的频带和对称分布的带宽明显提高了识别率;同FIR, Laguerre滤波器相比,尽管WFBs设计简单,但满足非对称性带宽分布的特性,因此ERB尺度的WFBs识别率更高,其噪音鲁棒性更好。(3)从待识别的语音信号本身出发,依据数字信号处理理论设计出优化滤波器组(Optimized Filter Bank, OFB)模型,并简化得到自适应带宽滤波器组(Adaptive Bands Filter Bank, ABFB)模型。FIR, Laguerre以及WFBs均是在人耳听觉感知准则上建立的滤波器模型,而OFB的设计则创新性地以识别性能为基准,首次通过遗传算法将前端滤波器和后端识别系统结合为一个整体,形成一个闭环系统进行优化。实现表明,OFB模型较Bark尺度滤波器明显提高了识别率,但由于其个数较多,不利于应用。因此简化OFB模型后得到ABFB模型,实验表明后者识别率仍明显高于Bark尺度滤波器,甚至优于ERB尺度滤波器。因此FIR, Laguerre, WFBs, ABFB四种滤波器中,ABFB滤波器的噪音鲁棒性最好,这也表明从分析语音信号本身出发对滤波器设计的重要性。(4)滤波器通道的个数,对滤波器分析信号的精度也有一定的影响。FIR,Laguerre, WFBs以及ABFB滤波器都是采用16通道的带通滤波器和16个频率箱提取ZCPA。使用Gammatone(GT)滤波器提取ZCPA时,采用K通道带通滤波器,并设计相应数目的频率箱接收幅度信息。实验表明,18通道较其他通道数的GT滤波器识别效果更好。(5)将FIR, GT, Laguerre,以及WFBs滤波器应用于多变性语料库的非特定人识别中,实验表明,随着滤波器性能的完善,其多变性鲁棒性也逐渐提高;且同MFCC特征相比,ZCPA在支持向量机(Support Vector Machine, SVM)系统下较在隐马尔可夫模型(Hidden Markov Model, HMM)下具有更好的多变性鲁棒性。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 图索引
  • 表索引
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 非特定人识别的研究及其面临的困难
  • 1.4 论文研究的主要内容及文章布局
  • 第2章 语音识别的基础理论
  • 2.1 语音信号的声学基础
  • 2.1.1 语音信号的产生
  • 2.1.2 语音信号的数学模型
  • 2.1.3 语音信号的感知
  • 2.2 语音识别系统框架
  • 2.2.1 预处理
  • 2.2.2 特征提取
  • 2.2.2.1 常见的时域特征参数
  • 2.2.2.2 常见的变换域特征参数
  • 2.3 识别算法
  • 2.3.1 径向基函数网络
  • 2.3.2 隐马尔可夫模型
  • 2.3.3 支持向量机模型
  • 2.4 小结
  • 第3章 Laguerre滤波器的设计和应用
  • 3.1 ZCPA特征提取过程
  • 3.2 Laguerre滤波器的设计
  • 3.2.1 Laguerre序列及其性质
  • 3.2.2 Laguerre滤波器结构
  • 3.2.3 Laguerre滤波器参数的计算
  • 3.3 Laguerre滤波器提取ZCPA的具体步骤
  • 3.4 仿真实验
  • 3.4.1 韩语语料库
  • 3.4.2 径向基函数网络(RBF)
  • 3.4.2.1 RBF网络的结构和映射
  • 3.4.2.2 RBF网络的学习算法
  • 3.4.2.3 RBF网络全监督训练算法
  • 3.4.3 实验结果及结论
  • 3.5 小结
  • 第4章 弯折滤波器的设计和应用
  • 4.1 Bark尺度
  • 4.2 ERB尺度
  • 4.3 双线性变换下的频率弯折
  • 4.4 频率弯折与听觉滤波器的设计
  • 4.5 16通道弯折滤波器的设计
  • 4.6 应用于ZCPA特征提取的弯折滤波器组的设计和仿真实验
  • 4.6.1 应用于ZCPA特征提取的弯折滤波器组的设计
  • 4.6.2 仿真实验
  • 4.7 小结
  • 第5章 自适应带宽滤波器组的设计和应用
  • 5.1 基本滤波器模型的建立
  • 5.1.1 Bark尺度滤波器
  • 5.1.2 基本滤波器模型
  • 5.1.2.1 移位和伸缩特性
  • 5.1.2.2 基本16通道滤波器组模型
  • 5.1.3 采用基本16通道滤波器模型构成Bark尺度滤波器
  • 5.2 采用遗传算法(GA)优化滤波器
  • 5.2.1 遗传算法
  • 5.2.2 优化滤波器组
  • 5.3 实验设置及相关参数
  • 5.3.1 语料库,ZCPA特征和RBF网络
  • 5.3.2 其他相关参数
  • 5.3.3 实验结果
  • 5.4 小结
  • 第6章 多通道Gammatone滤波器的实现和应用
  • 6.1 Gammatone滤波器
  • 6.2 用于ZCPA特征提取的GT滤波器
  • 6.3 仿真实验
  • 6.4 小结
  • 第7章 多种前端滤波器对语音多变性鲁棒性的应用研究
  • 7.1 语音信号的多变性
  • 7.2 OLLO语料库
  • 7.3 多种前端滤波器
  • 7.3.1 FIR滤波器
  • 7.3.2 Gammatone(GT)滤波器
  • 7.3.3 Laguerre滤波器
  • 7.3.4 弯折滤波器
  • 7.4 隐马尔可夫模型(HMM)
  • 7.4.1 HMM的组成
  • 7.4.2 HMM的三个基本问题
  • 7.4.3 HMM基本算法
  • 7.5 支持向量机模型(SVM)
  • 7.6 仿真实验
  • 7.6.1 SVM与HMM对比
  • 7.6.2 各种前端滤波器的ZCPA实验对比
  • 7.7 小结
  • 第8章 总结与展望
  • 8.1 总结
  • 8.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的论文
  • 攻读博士期间的科研项目
  • 相关论文文献

    • [1].体声波滤波器功率容量的评估方法[J]. 压电与声光 2019(06)
    • [2].可重构滤波器研究进展综述[J]. 微波学报 2020(01)
    • [3].一种生物滤波器的设计[J]. 上海电气技术 2020(03)
    • [4].一款低损耗低噪声宽调谐的高阶级联N通道滤波器[J]. 广西师范大学学报(自然科学版) 2019(04)
    • [5].多级EMI滤波器优化设计方法研究[J]. 山东工业技术 2018(20)
    • [6].联合约束级联交互式多模型滤波器及其在机动目标跟踪中的应用[J]. 电子与信息学报 2017(01)
    • [7].双传输零点C波段腔体滤波器的设计与实现[J]. 微波学报 2016(S1)
    • [8].抑制双摆龙门起重机货物摆动的时滞滤波器研究[J]. 建筑机械化 2017(03)
    • [9].信号通过滤波器的时延分析[J]. 黑龙江科技信息 2017(16)
    • [10].增强超导滤波器谐波抑制能力的方法[J]. 低温与超导 2017(08)
    • [11].一种基于共址滤波器解决同址多台的方法[J]. 移动通信 2015(16)
    • [12].浅谈滤波器的技术与应用[J]. 课程教育研究 2019(33)
    • [13].大功率滤波器的研究与推广策略[J]. 电子世界 2020(02)
    • [14].质子束流蒙特卡罗模型的建立及对脊形滤波器的探究[J]. 中国医学物理学杂志 2020(05)
    • [15].新型并联电容混合型电力滤波器的仿真研究[J]. 自动化与仪表 2020(06)
    • [16].一种适用于水声移动通信同步检测的组合滤波器[J]. 西北工业大学学报 2020(05)
    • [17].尺度补偿的相关核滤波器跟踪[J]. 计算机科学 2016(S2)
    • [18].一种应用于低功耗多模式射频芯片的可重构滤波器[J]. 中国集成电路 2016(12)
    • [19].势平衡多目标多伯努利滤波器高斯混合实现的收敛性分析[J]. 控制理论与应用 2016(10)
    • [20].复阻抗负载滤波器综合及多工器设计应用[J]. 电子设计工程 2017(04)
    • [21].融合颜色特征的核相关滤波器目标跟踪[J]. 电光与控制 2017(06)
    • [22].甚高频滤波器失配导致发射机高频段整机效率过高的原因分析[J]. 无线互联科技 2017(08)
    • [23].一种小区重叠干扰下的通信滤波器噪声抑制算法[J]. 科技通报 2016(03)
    • [24].声表面滤波器焊接工艺探讨[J]. 电子工艺技术 2016(05)
    • [25].可调滤波器的应用和发展[J]. 电子元件与材料 2016(09)
    • [26].一种可调滤波器的设计技术[J]. 无线电工程 2015(04)
    • [27].一种可调谐滤波器特性研究[J]. 光通信技术 2015(03)
    • [28].带有前置和后置滤波器的滑模观测器仿真研究[J]. 湖南工业大学学报 2013(05)
    • [29].一种梯形结构可调声表滤波器的仿真与分析[J]. 声学技术 2013(S1)
    • [30].基片集成波导缝隙式滤波器的设计与实现[J]. 固体电子学研究与进展 2014(04)

    标签:;  ;  ;  ;  ;  ;  

    非特定人鲁棒性语音识别中前端滤波器的研究
    下载Doc文档

    猜你喜欢