语音识别的环境噪音抑制研究

语音识别的环境噪音抑制研究

论文摘要

本论文主要的研究内容是基于噪音环境下的语音识别性能的改进研究。语音识别是指利用计算机通过识别和理解把人类的语音信号转变为相应的文本或命令技术。然而,大多数语音识别系统都只适合于识别安静环境中的语音,当它们应用于噪音环境中时,性能却大大降低。因此,在噪音环境下进行语音识别是现阶段语音识别发展过程中的一个难点。虽然如此,但它在我们这种高速发展的信息时代却有着可观的实用价值。作者从语音识别的端点检测进行了研究,搭建了包括语音采集、噪音合成、特征提取,直到产生识别结果的在内的语音识别软件系统平台。在该平台的基础上,做了下面的改进研究:(1)提出一种端点检测的新算法:研究表明,即使在安静的环境中,语音识别系统一半以上的识别错误来自端点检测器。因此,作为语音识别系统的第一步,端点检测的重要性是不容忽视的,尤其是噪音环境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。所以,本文给出了一种基于线性预测系数(LPC)距离算法的端点检测方案,可以有效的解决强噪音环境下的端点检测问题。(2)基于新算法的改进:在强噪声情况下,LPC距离算法可以有效抑制噪音,可是它也有自己的不足之处,即不能在高信噪比的条件下进行有效的端点检测,而这恰恰是传统算法的长处,所以作者就考虑将两者结合起来,将两者的参数进行组合,实验证明,这种方法可以较大范围地满足噪音环境下的端点检测要求,进而可以更好地抑制环境噪音。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • CONTENTS
  • 第一章 绪论
  • 1.1 语音识别的定义
  • 1.2 语音识别的发展简介
  • 1.3 语音识别技术的应用
  • 1.3.1 语音信息检索
  • 1.3.2 发音学习技术
  • 1.3.3 基于语音的情感处理
  • 1.3.4 网络环境下的语音识别
  • 1.3.5 嵌入式语音识别技术
  • 1.4 语音识别基本原理
  • 1.5 语音识别系统的分类
  • 1.5.1 按照词汇表大小分
  • 1.5.2 按照发音方式分
  • 1.5.3 按照说话人的限定范围分
  • 1.5.4 按照识别方法分
  • 1.6 语音识别面临的主要的问题
  • 1.6.1 语音识别的方言和口音问题
  • 1.6.2 信道问题
  • 1.6.3 背景噪音问题
  • 1.6.4 自然语音理解领域
  • 1.6.5 语音合成
  • 1.7 本论文要完成的内容
  • 第二章 语音信号处理基本原理
  • 2.1 语音信号产生的生理机制
  • 2.1.1 语音信号产生及特征
  • 2.1.2 人耳感知特性和噪音特性
  • 2.1.3 语音信号产生的数学模型
  • 2.2 语料库
  • 2.2.1 语料库的概述
  • 2.2.2 语音语料库的建立和收集要点
  • 2.3 语音识别单元的选取
  • 2.4 语音信号数字化及预处理
  • 2.4.1 语音信号预滤波、语音采样、A/D变换
  • 2.4.2 语音信号预处理
  • 2.5 语音信号分析方法
  • 2.5.1 时域处理方法
  • 2.5.2 频域处理方法
  • 2.5.3 同态处理及倒谱域特征提取方法
  • 2.6 小结
  • 第三章 语音识别的主要模型
  • 3.1 概述
  • 3.2 高斯混合模型
  • 3.2.1 高斯混合模型的定义
  • 3.2.2 高斯混合模型的迭代算法
  • 3.3 隐马尔可夫模型(HMM)
  • 3.3.1 隐马尔可夫模型的数学描述
  • 3.3.2 隐马尔可夫模型的结构类型
  • 3.3.3 HMM算法实现的问题
  • 3.4 小结
  • 第四章 噪音情况下的端点检测
  • 4.1 端点检测原理
  • 4.2 经典方法的比较
  • 4.3 分析与改进设想
  • 4.4 基于 LPC距离的综合研究方法
  • 4.5 小结
  • 第五章 系统仿真
  • 5.1 强噪音环境下端点检测平台的建立
  • 5.1.1 软件平台
  • 5.1.2 语音库
  • 5.2 实验结果及分析
  • 5.3 展望
  • 5.4 小结
  • 结论
  • 1.总结
  • 2.展望
  • 参考文献
  • 攻读学位期间发表论文和获奖
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    语音识别的环境噪音抑制研究
    下载Doc文档

    猜你喜欢