非特定人连续数字语音识别研究

非特定人连续数字语音识别研究

论文摘要

语音识别研究的理论研究已经非常成熟,达到了很高的识别效果。我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。然而,由于将语音识别应用于实际时,存在背景噪音、方言口音、口语等多方面的影响,一直没有在实际中取得广泛应用。尤其对于嵌入式应用场合,面临着非常复杂的环境,更要解决这些影响,使语音识别系统能应用于实际使用环境。由于论文在语音识别方面的研究刚刚起步,且大词汇量语音识别系统需要建立词典涉及到很多语言学知识,并且需要大型语音库,因此论文主要研究了非特定人数字串语音识别系统,内容包括自适应端点检测门限研究,Mel倒谱系数(MFCC)各维系数对识别结果的贡献,持续时间状态模型的参数选取,以及隐马尔可夫(HMM)状态数选取,训练集大小选取等问题。端点检测方面,在分析了经典双门限检测方法后,认为经典方法中,高门限取值为多帧语音数据能量平均值乘以固定系数a(a=1)在信噪比改变的情况下是不合理的,需要在实际应用之前,对系统进行自适应,通过逐步逼近的方法取得合适的系数a,再进行识别。实验证明,对系统进行自适应后,大大提高了系统的信噪比应用范围。MFCC系数是语音识别领域一个非常有效的声学特征,传统实验认为,由于前两维系数反应的是幅度值,对识别结果有负效果,应该丢弃MFCC的第一维和第二维。然而,经过实验后发现,虽然这两维系数对区分数字贡献不大,但是可以用来区分语音和背景噪音,可以应用在端点检测阶段,不应该简单丢弃。最后,论文还对持续时间状态模型的参数选取,HMM状态数和训练集大小进行了实验,结果表明持续时间的均值为220ms,方差为60ms,HMM状态数为5,训练集大小为30是比较合理的。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 背景目的和意义
  • 1.2 语音识别的基本概念
  • 1.3 发展历史和国内外现状
  • 1.3.1 语音识别的早期研究(76年以前)
  • 1.3.2 语音识别的中期研究(77年-82年)
  • 1.3.3 语音识别的近期研究(83年-95年)
  • 1.3.4 语音识别的现状(96年至今)
  • 1.4 研究内容
  • 2 前端处理与特征提取
  • 2.1 前端处理
  • 2.1.1 流程简介
  • 2.1.2 预加重
  • 2.1.3 分帧
  • 2.1.4 加窗
  • 2.1.5 低通滤波
  • 2.2 端点检测
  • 2.2.1 端点检测的目的
  • 2.2.2 传统算法
  • 2.2.3 自适应算法
  • 2.2.4 实验结果与讨论
  • 2.2.5 在端点检测中使用频域特征的探索
  • 2.3 特征提取
  • 2.3.1 常用声学特征
  • 2.3.2 MFCC基本原理与计算流程
  • 2MFCC'>2.3.3 MFCC,△MFCC与△2MFCC
  • 2.3.4 各维对识别结果的贡献
  • 3 HMM基本原理
  • 3.1 一般Markov模型
  • 3.2 隐Markov模型(HMM)
  • 3.3 连续HMM
  • 3.4 持续时间状态模型
  • 4 HMM应用于语音识别
  • 4.1 基本原理
  • 4.2 孤立词识别到连续词识别的转换(LB算法)
  • 4.3 多个训练集的处理
  • 4.4 系统实验与分析
  • 4.4.1 实验环境与数据库的建立
  • 4.4.2 HMM转移矩阵的选择
  • 4.4.3 HMM状态数的确定
  • 4.4.4 训练集大小的影响
  • 4.5 错误分析
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].广电智能语音识别系统建设实施方案[J]. 中国有线电视 2020(03)
    • [2].面向语音识别系统的黑盒对抗攻击方法[J]. 小型微型计算机系统 2020(05)
    • [3].压电陶瓷的声带振动语音识别系统[J]. 单片机与嵌入式系统应用 2020(07)
    • [4].分区域方言客服语音识别系统研究[J]. 网络新媒体技术 2019(01)
    • [5].早晚期混响划分对理想比值掩蔽在语音识别性能上的影响[J]. 声学学报 2019(04)
    • [6].嵌入式实时英语语音识别系统的设计与研究[J]. 电子设计工程 2017(08)
    • [7].基于嵌入式的语音识别系统设计与实现[J]. 长春师范大学学报 2017(10)
    • [8].浅析小型语音识别系统的研究和开发[J]. 信息化建设 2015(10)
    • [9].法苑传真[J]. 江淮法治 2016(22)
    • [10].语音识别系统[J]. 少先队活动 2014(05)
    • [11].英语翻译器语音识别系统的设计及功能实现[J]. 微型电脑应用 2018(12)
    • [12].嵌入式语音识别系统的测试方法研究[J]. 计算机技术与发展 2019(07)
    • [13].基于人工智能深度学习的语音识别方法[J]. 信息记录材料 2017(09)
    • [14].一种用于无线通信的数字语音识别系统设计[J]. 现代电子技术 2016(16)
    • [15].英语翻译器语音识别系统设计及其应用[J]. 电子测试 2015(04)
    • [16].简单语音识别系统的设计实现[J]. 中国新通信 2013(16)
    • [17].语音识别系统的硬件设计[J]. 硅谷 2012(02)
    • [18].基于改进谱减法的语音识别系统去噪[J]. 大众科技 2012(12)
    • [19].神田公司采用语音识别系统提高发货效率[J]. 物流技术与应用 2009(06)
    • [20].一种基于隐马尔科夫模型的跑步机语音识别系统设计[J]. 信息技术与信息化 2020(09)
    • [21].智能语音识别系统噪声鲁棒性研究[J]. 信息技术与标准化 2019(06)
    • [22].基于香橙派的智能语音识别系统的设计[J]. 电子测量技术 2019(19)
    • [23].重庆方言语音识别系统的设计与实现[J]. 计算机测量与控制 2018(01)
    • [24].一种语音识别的可定制云计算方法[J]. 中国海洋大学学报(自然科学版) 2014(01)
    • [25].嵌入式语音识别系统研究[J]. 电脑与信息技术 2014(01)
    • [26].实时语音识别系统在家庭监护机器人的实现[J]. 电子设计工程 2012(07)
    • [27].基于小波去噪的语音识别系统[J]. 数字技术与应用 2012(05)
    • [28].出行者信息服务系统中后台语音识别系统的研究[J]. 交通标准化 2011(Z1)
    • [29].基于深度学习的移动端语音识别系统设计[J]. 单片机与嵌入式系统应用 2020(09)
    • [30].嵌入式英语语音识别系统误差自动检测方法研究[J]. 自动化与仪器仪表 2019(09)

    标签:;  ;  ;  ;  

    非特定人连续数字语音识别研究
    下载Doc文档

    猜你喜欢