变换域中基于广义伽玛分布的软语音活动检测算法研究

变换域中基于广义伽玛分布的软语音活动检测算法研究

论文摘要

本文通过研究总结典型的语音活动检测方法,结合语音信号和噪声信号的特点,利用更接近实际语音信号分布的广义伽玛模型,提出了一种在变换域中基于统计模型的软语音活动检测算法。该算法从离散余弦变换出发,首先将语音信号和噪声信号的样值进行解相关,并假设其解相关后的样值服从更接近实际语音信号分布的广义伽玛分布(GΓD)。在参数估计中,利用一个与全局语音不存在概率(GSAP)相结合的即时最大似然(ML)参数估计算法对模型的参数进行估计。在判决准则中,本文提出的VAD算法采用平滑似然率(SLR)测试代替了传统的似然率(LR)测试以克服统计量计算中时延项带来的缺点。通过仿真实验可以看出,平滑似然率的引入有效地改善了语音活动检测算法在语音波动期间性能的退化。为了进一步提高算法的检测性能,本文采用了一个基于隐马尔可夫模型(HMM)的软判决准则。根据连续出现的语音帧之间具有强相关性这一性质,将帧的状态序列看成一个一阶马尔可夫过程,并利用HMM来估计每一帧VBA(Voice Being Activity)的概率,以此来避免语音尾部的弱语音夹断。实验结果表明,在低信噪比以及多种噪声条件下,该算法的性能均在一定程度上优于G.729附录B中的VAD算法和传统的基于高斯统计模型的VAD算法。

论文目录

  • 提要
  • 第一章 绪论
  • 1.1 语音信号处理
  • 1.1.1 语音信号处理简介
  • 1.1.2 语音信号处理的发展历史及现状
  • 1.2 语音活动检测技术的发展历史
  • 1.3 研究背景和意义
  • 1.4 本文的主要工作与内容安排
  • 第二章 语音信号和噪声信号
  • 2.1 语音信号分析
  • 2.1.1 语音信号的产生
  • 2.1.2 语音信号产生的数学模型
  • 2.2 语音信号的分析与处理
  • 2.2.1 语音信号的预处理
  • 2.2.2 语音信号的时域分析
  • 2.2.3 语音信号的频域分析
  • 2.2.4 语音信号的倒谱分析
  • 2.3 噪声分析
  • 2.4 语音信号和噪声信号性质小结
  • 第三章 语音活动检测的基本原理
  • 3.1 VAD的一般模型
  • 3.2 VAD算法中的假设和难点
  • 3.3 语音信号的特征量提取
  • 3.3.1 能量
  • 3.3.2 过零率
  • 3.3.3 周期性
  • 3.3.4 信息熵
  • 3.3.5 LPC系数
  • 3.3.6 倒谱系数
  • 3.3.7 小结
  • 3.4 VAD算法性能的评价
  • 第四章 语音活动检测算法的研究现状
  • 4.1 引言
  • 4.2 VAD算法分类
  • 4.2.1 基于阈值的VAD算法
  • 4.2.2 基于统计模型的VAD算法
  • 4.3 VAD经典算法
  • 4.3.1 ITU-T G.729 Annex B VAD算法
  • 4.3.2 GSM VAD算法
  • 4.3.3 基于高斯统计模型的VAD算法
  • 第五章 基于广义伽玛分布的软语音活动检测算法
  • 5.1 语音信号的解相关
  • 5.2 语音和噪声信号的统计模型
  • 5.2.1 广义伽玛分布(GΓD )
  • 5.2.2 GΓD 的即时参数估计
  • 5.3 基于GΓD 的VAD判决准则
  • 5.3.1 GSAP(Global Speech Absence Probability)
  • 5.3.2 平滑似然率(SLR)测试
  • 5.4 基于HMM的软判决准则
  • 5.5 计算机仿真实验和结果分析
  • 5.6 结论
  • 第六章 全文总结与展望
  • 6.1 全文总结
  • 6.2 展望
  • 参考文献
  • 摘要
  • ABSTRACT
  • 致谢
  • 导师及作者简介
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [9].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [10].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [11].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [12].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [13].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [14].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [15].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [16].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [17].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [18].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [19].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [20].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [21].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [22].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [23].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [24].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [25].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [26].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [27].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [28].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [29].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)
    • [30].冷,冷,冷[J]. 意林(原创版) 2019(02)

    标签:;  ;  ;  ;  ;  

    变换域中基于广义伽玛分布的软语音活动检测算法研究
    下载Doc文档

    猜你喜欢