基于飞行器的连续语音指令识别技术研究

基于飞行器的连续语音指令识别技术研究

论文摘要

本课题主要研究在航空领域中飞行器语音指令识别技术。研究目的是丰富飞行器控制方式,减轻飞行员操作强度,提高控制速度和安全性能。本课题对我国航空事业的发展具有重要的现实意义和实用价值。首先,论文分析了传统语音端点检测算法应用于航空背景检测性能下降的原因,从强度和类型两个方面对航空噪声进行了研究,给出了一个门限值自适应调整的基于变噪声环境语音端点检测算法。仿真结果表明,该算法在各种噪声环境下的端点检测性能明显优于传统算法。另外,从计算复杂度的角度对传统特征提取算法进行了分析研究,发现其计算量太大,影响系统实时性。针对这一问题对算法进行了改进,经多次实验确定了算法的最优参数。改进后的算法在计算量上减少了一半,相应的识别率仅减少0.5%,对应用需求的影响可忽略不计。论文中还介绍了隐马尔可夫模型技术在语音识别中的应用,研究了声学模型、语言模型和搜索算法的基本原理和实现方法,针对传统Viterbi beam搜索算法设定固定剪枝门限值的缺点,给出一个自适应调整剪枝门限的搜索算法。算法分析结果表明,该算法具有一定的优越性。最后,使用Visual C++开发平台构建了一个小型的基于飞行器的连续语音指令识别系统,通过实验确定了最优参数,该语音指令识别系统的平均识别率达到98.5%。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 诸论
  • 1.1 课题研究背景与意义
  • 1.2 语音识别技术发展历史及研究现状
  • 1.2.1 国外研究历史及现状
  • 1.2.2 国内研究历史及现状
  • 1.2.3 飞行器语音指令识别技术研究概况
  • 1.3 课题主要研究内容
  • 1.4 论文组织结构
  • 第二章 隐马尔可夫模型(HMM)技术
  • 2.1 引言
  • 2.2 隐马尔可夫模型基本原理
  • 2.3 隐马尔可夫模型的三个基本问题
  • 2.3.1 问题1 的解决:前向-后向算法
  • 2.3.2 问题2 的解决:VITERBI 搜索算法
  • 2.3.3 问题3 的解决:BAUM-WELCH 参数重估算法
  • 2.4 连续密度隐马尔可夫模型(CDHMM)
  • 2.5 隐马尔科夫模型的类型
  • 2.6 小结
  • 第三章 语音识别前端处理
  • 3.1 引言
  • 3.2 语音信号预处理
  • 3.2.1 采样与量化
  • 3.2.2 预加重
  • 3.2.3 分帧加窗
  • 3.3 特征参数提取
  • 3.3.1 几种特征参数的比较
  • 3.3.2 美尔频率倒谱参数(MFCC)
  • 3.3.3 一种新的MFCC 特征提取改进算法
  • 3.3.4 特征提取模块界面与功能简介
  • 3.3.5 实验分析
  • 3.4 小结
  • 第四章 航空背景环境下语音端点检测算法
  • 4.1 引言
  • 4.2 最小美尔尺度频带参数
  • 4.2.1 基于听觉的美尔尺度滤波器组
  • 4.2.2 最小能量频带的选择
  • 4.2.3 MIMSB 参数有效性实验
  • 4.3 增强时频参数
  • 4.4 端点检测算法
  • 4.5 实验分析
  • 4.5.1 标注法分析
  • 4.5.2 识别率分析
  • 4.6 小结
  • 第五章 飞行器连续语音指令识别系统的实现
  • 5.1 引言
  • 5.2 语音指令识别系统框架
  • 5.3 基本模型单元的选择
  • 5.4 声学HMM 训练
  • 5.4.1 模型初始化
  • 5.4.2 单个模型重估
  • 5.4.3 嵌入式模型重估
  • 5.4.4 HMM 训练模块界面与功能简介
  • 5.5 语言模型
  • 5.6 搜索算法
  • 5.6.1 VITERBI 全搜索算法
  • 5.6.2 VITERBI BEAM 搜索算法
  • 5.6.3 VITERBI BEAM 搜索算法实现
  • 5.6.4 识别模块界面与功能简介
  • 5.7 系统性能评估
  • 5.7.1 语音指令库
  • 5.7.2 识别性能评估标准
  • 5.7.3 实验分析与最优参数确定
  • 5.8 小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 进一步研究的展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 附录
  • 相关论文文献

    • [1].汉语连续语音切分技术研究[J]. 计算机与数字工程 2020(08)
    • [2].基于主成分分析的汉语连续语音切分算法[J]. 应用声学 2011(05)
    • [3].3~5岁健听儿童连续语音切换清晰度的研究[J]. 听力学及言语疾病杂志 2010(05)
    • [4].连续语音的神经编码——脑电图、脑磁图研究进展[J]. 生理学报 2019(06)
    • [5].实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J]. 语言文字应用 2013(S1)
    • [6].基于相关维数的病变连续语音检测算法[J]. 华南理工大学学报(自然科学版) 2012(06)
    • [7].支持向量机的汉语连续语音声调识别方法[J]. 计算机科学 2010(05)
    • [8].基于维吾尔语单词清、浊音组成结构特征的连续语音单词切分算法[J]. 西北师范大学学报(自然科学版) 2013(04)
    • [9].非特定人问候语连续语音识别技术的研究[J]. 浙江工业大学学报 2010(05)
    • [10].基于元音检测的汉语连续语音声韵母分割[J]. 计算机工程与应用 2011(14)
    • [11].基于隐马尔可夫模型的连续语音同步识别系统[J]. 现代电子技术 2019(11)
    • [12].基于三音子模型连续语音声调识别方法[J]. 电声技术 2011(08)
    • [13].一种藏语连续语音声学特征参数提取算法研究[J]. 通信技术 2019(08)
    • [14].基于Praat的藏语连续语音参数提取仿真和分析[J]. 电子技术与软件工程 2019(20)
    • [15].基于多空间概率分布的汉语连续语音声调识别研究[J]. 计算机科学 2011(09)
    • [16].基于分形维的连续语音实时分割技术[J]. 电讯技术 2008(11)
    • [17].基于元音检测的汉语连续语音端点检测方法[J]. 计算机工程与应用 2010(27)
    • [18].基于改进神经网络的三字词声调识别方法[J]. 电声技术 2010(05)
    • [19].藏语连续语音语料库设计与实现[J]. 计算机工程与应用 2010(13)
    • [20].基于HMM的连续语音中的关键词检测[J]. 黑龙江科技信息 2008(32)
    • [21].一种改进的连续语音特征提取算法[J]. 长春理工大学学报(自然科学版) 2014(01)
    • [22].改进的基于点过程模型的连续语音关键词识别技术[J]. 电路与系统学报 2013(02)
    • [23].一种基于模式识别的多路盲语音提取方法[J]. 应用声学 2008(03)
    • [24].基于点过程模型连续语音关键词检测[J]. 太赫兹科学与电子信息学报 2013(06)
    • [25].基于压缩感知和MFCC的语音端点检测算法[J]. 测控技术 2019(05)
    • [26].维吾尔语音素的声学特征分析[J]. 中文信息学报 2014(01)
    • [27].听障儿童构音能力和连续语音重复能力的关系研究[J]. 中国特殊教育 2010(09)
    • [28].连续汉语语音切分技术研究[J]. 计算机与数字工程 2019(07)
    • [29].一种新的汉语连续语音声调评测算法[J]. 声学技术 2013(04)
    • [30].结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J]. 声学学报 2019(01)

    标签:;  ;  ;  ;  ;  ;  

    基于飞行器的连续语音指令识别技术研究
    下载Doc文档

    猜你喜欢