复杂环境下语音增强方法研究

复杂环境下语音增强方法研究

论文摘要

语音是人们交流和通讯的主要方式之一,但语音信号往往不可避免地被噪声污染。带噪语音会使人的听觉感受变得糟糕,甚至让人难以捕获其所带的语音信息。在语音编码。语音识别。说话人识别等系统中,噪声也会严重影响应用的效果。因此,对语音进行增强十分有必要。目前,语音增强的效果还不能达到人们的要求,主要问题有增强语音中存在着残留噪声;算法不具有普遍性,只能处理特定类型的噪声;计算复杂度较高等。针对这些问题,本文研究复杂环境下的语音增强算法。研究的目标是使算法能够适应多种噪声类型且噪声特征随时间变化剧烈的复杂环境,提高增强效果,减少残留噪声,并改善算法的计算复杂度。本文主要的工作和创新点有:τ1υ对语音增强算法进行了全面系统的总结分析。将单通道语音增强算法划分为基于线性滤波的方法。基于短时谱估计的方法。基于语音模型的方法。基于听觉掩蔽效应的方法以及语音增强新方法等五类进行了详细地分析,对各算法的特点和缺点。计算复杂度作了对比。简要介绍了双通道和多通道语音增强算法,并对语音增强的发展方向进行了讨论。τ2υ提出并实现了一种最优改进对数谱幅度估计τOM-LSA,Optimally Modified Log-Spectral Amplitude Estimator)和小波阈值去噪结合的语音增强方法,并实验验证了算法的有效性。针对OM-LSA算法中存在的残留噪声,利用小波阈值去噪法对残余噪声进行处理,提出了估计残余噪声的方法。首先对原始带噪语音进行小波分解估计出原始噪声方差,再结合语音不存在时的增益函数,得到了准确的残留噪声估计。给出了OM-LSA和小波阈值去噪结合的语音增强算法过程,并进行了实现。利用专门的语音增强测试数据库进行大量数据实验,结果表明,提出的算法有效地去除了OM-LSA算法的残留噪声,在分段信噪比和对数谱失真等指标评价上有较大的提高。τ3υ提出了并实现了基于HMMτHidden Markov Modelυ融合语音分离的语音增强方法,并实验验证了算法的有效性。已有的两种基于HMM的语音增强算法是用于平稳噪声的MAPτMax A Posteriorυ语音估计算法和用于非平稳噪声的MMSE(Minimum Mean-Square Error)语音估计算法,两种算法计算量都较大,且前者不能处理非平稳噪声。针对这些缺点,借鉴语音分离算法,设计了基于HMM融合语音分离的语音增强算法。首先对带噪语音在语音模型和噪声模型下的混合状态进行解码,然后利用语音分离方法进行语音估计。实现了算法,对不同噪声类型和信噪比下的大量带噪语音数据进行了实验,并对结果进行了客观指标评价。结果表明,算法能够有效地去除平稳噪声和非平稳噪声,PESQ (PerceptualEvaluation of Speech Qualityυ得分评价有较大的提高,算法时间得到了控制。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究问题的提出
  • 1.2 语音增强的研究基础
  • 1.2.1 语音增强的研究历史
  • 1.2.2 语音?听觉及噪声特性
  • 1.2.3 语音数字信号处理技术
  • 1.3 主要研究内容及贡献
  • 1.3.1 研究范畴
  • 1.3.2 研究思路
  • 1.3.3 主要工作及贡献
  • 1.4 本文组织结构
  • 第二章 语音增强相关研究工作
  • 2.1 单通道语音增强方法
  • 2.1.1 基于线性滤波的方法
  • 2.1.2 基于短时谱估计的方法
  • 2.1.3 基于语音模型的方法
  • 2.1.4 基于听觉掩蔽的方法
  • 2.1.5 语音增强新方法
  • 2.2 单通道语音增强方法总结
  • 2.3 双通道和多通道语音增强方法
  • 2.3.1 双通道语音增强算法
  • 2.3.2 多通道语音增强方法
  • 2.4 本章小结
  • 第三章 OM-LSA 和小波阈值去噪结合的语音增强方法
  • 3.1 问题建模和语音估计
  • 3.1.1 问题建模
  • 3.1.2 统计模型
  • 3.1.3 语音估计
  • 3.2 语音存在概率?噪声及先验信噪比估计
  • 3.2.1 语音存在概率估计
  • 3.2.2 噪声估计
  • 3.2.3 先验信噪比估计
  • 3.3 OM-LSA 和小波阈值去噪结合的语音增强
  • 3.3.1 问题提出及解决思路
  • 3.3.2 算法过程
  • 3.4 实验及结果分析
  • 3.4.1 评价指标
  • 3.4.2 实验设计
  • 3.4.3 结果分析
  • 3.5 本章小结
  • 第四章 基于HMM 融合语音分离的语音增强方法
  • 4.1 HMM 构建
  • 4.1.1 HMM 结构选择
  • 4.1.2 HMM 建模过程
  • 4.2 基于HMM 的语音估计
  • 4.2.1 高斯平稳噪声下的语音估计
  • 4.2.2 非平稳噪声下的语音估计
  • 4.2.3 两种语音估计算法的比较
  • 4.3 基于HMM 融合信号分离的语音增强
  • 4.3.1 混合状态解码
  • 4.3.2 融合语音分离的语音估计
  • 4.3.3 算法总结
  • 4.4 实验及结果分析
  • 4.4.1 算法实现
  • 4.4.2 增强效果分析
  • 4.4.3 状态数的影响
  • 4.4.4 大量数据实验及客观评价
  • 4.5 小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 附录A 主要数学符号列表
  • 附录B 英文缩写词对照表
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].语音欺骗检测方法的研究现状及展望[J]. 数据采集与处理 2020(05)
    • [9].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [10].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [11].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [12].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [13].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [14].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [15].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [16].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [17].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [18].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [19].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [20].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [21].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [22].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [23].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [24].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [25].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [26].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [27].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [28].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [29].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [30].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)

    标签:;  ;  ;  ;  ;  

    复杂环境下语音增强方法研究
    下载Doc文档

    猜你喜欢