语音关键词识别技术的研究

语音关键词识别技术的研究

论文摘要

关键词识别是语音识别的一个重要研究领域,关键词识别不仅比连续语音识别灵活性好,而且具有很高的应用价值。本文对几种关键词检测技术进行了研究,这些技术适用于不同的应用场合,其中基于垃圾模型的关键词检测技术主要应用在实时的命令词检测和对话系统,基于音节格和混淆网络的关键词检测技术可应用于大词表音频文档内容检索。本文的研究重点为关键词识别系统的检出策略和确认方法,主要的工作及创新包括以下几个方面:1.基于垃圾模型的关键词系统中的语音确认算法在基于垃圾模型的关键词系统中,常利用似然比方法进行语音确认。提出了一种基于竞争模型的加权似然比融合语音确认方法,通过联合目标模型与其竞争模型的似然比对子词的置信度进行估计,引入了最小确认错误准则训练融合的权重系数。实验表明该方法优于传统的似然比方法。通过分析关键词检测系统的置信特征,选择动态垃圾得分、似然比和驻留概率等特征计算关键词候选的置信度,实验表明这些特征的组合能够明显提高系统的拒识性能。2.音节格关键词识别系统中关键词检出算法和验证方法由于缺乏高层语言指导,基于音节格的关键词检测系统的检测率通常比较低。提出了一种改进的基于最小编辑距离(MED)的关键词搜索算法,在依赖于系统的替代错误发生时考虑了上下文高阶音节混淆。在关键词验证阶段,给出了一个新的置信度函数来压制由MED搜索带来的虚警。实验结果表明,提出的搜索策略和验证方法明显优于传统的字符串匹配方法,具有较高的检测率和置信能力。3.基于音节混淆网络的语音文档内容检索技术设计了一个基于音节混淆网络的语音文档内容检索系统,对检索系统的索引机制进行了研究,实验结果表明该系统整体性能明显优于基于音节网格的关键词系统。提出了改进的基于两阶段解码的查询自动扩展策略,首先通过Viterbi解码获得混淆音节网格,然后利用A~*解码算法从音节格上产生易混淆的扩展项。通过扩展项的置信度控制查询扩展的数目,实验结果显示该方法能够有效提高查询的检出率。4.语音识别结果的错误纠正方法的研究介绍了一种基于分而治之思想的语音错误纠正方案并用于音节识别任务。利用混淆网络把连续语音识别问题转换为顺序的、独立的分类子任务,每个分类任务可以看做是孤立词识别问题,通过训练专门的支持向量机来区分混淆网络的识别候选。提出了一种基于码本映射的特征变换方法,把可变长度的语音段转换为适合支持向量机处理的固定维数特征。联合基于混淆网络的和支持向量机的后验概率估计进行错误纠正,实验结果表明该方法能够有效提高系统的准确率。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 关键词识别的发展简史和研究现状
  • 1.2 关键词检测系统的框架
  • 1.3 系统的性能评测
  • 1.4 关键词检测的研究意义
  • 1.5 论文的研究内容
  • 1.6 论文结构安排
  • 第二章 连续语音识别原理
  • 2.1 连续语音识别基本框架
  • 2.2 声学特征和声学模型
  • 2.2.1 声学特征
  • 2.2.2 声学模型
  • 2.3 语言模型
  • 2.4 解码器
  • 2.4.1 帧同步Viterbi解码
  • 2.4.1.1 基本Viterbi算法
  • 2.4.1.2 连续语音识别中的帧同步Viterbi搜索
  • 2.4.2 A*堆栈解码算法
  • 2.4.3 语音识别的输出
  • 第三章 基于垃圾模型的关键词检测技术
  • 3.1 基于垃圾模型的语音关键词检测模块的设计
  • 3.1.1 基于垃圾模型的关键词检出原理
  • 3.1.2 影响关键词系统性能的因素
  • 3.1.3 关键词检测基线系统设计方案
  • 3.2 基于似然比的关键词语音确认方法
  • 3.3 基于竞争模型的加权似然比融合的语音确认方法
  • 3.3.1 基于MVE的参数优化
  • 3.3.2 实验设定与结果
  • 3.4 多置信特征联合提高语音确认效果
  • 3.4.1 实验结果
  • 3.5 本章小结
  • 第四章 基于音节网格的关键词搜索验证算法的研究
  • 4.1 引言
  • 4.2 音节网格结构
  • 4.3 基于lattice的关键词后验概率估计
  • 4.4 在lattice上检测关键词
  • 4.4.1 模型的相似度
  • 4.4.1.1 基于专家知识的方法
  • 4.4.1.2 基于数据驱动的方法
  • 4.4.2 基于改进MED的字符串相似度
  • 4.4.3 基于改进MED的关键词搜索算法
  • 4.5 改进的关键词置信度
  • 4.6 关键词输出准则
  • 4.7 实验设定与结果
  • 4.9 本章小结
  • 第五章 基于音节混淆网络的语音文档内容检索技术
  • 5.1 引言
  • 5.2 混淆网络
  • 5.3 STD技术研究简介
  • 5.4 一个基于音节混淆网络的STD系统
  • 5.4.1 系统设计方案
  • 5.4.2 实验结果与分析
  • 5.5 基于改进两阶段解码的查询扩展
  • 5.5.1 实验结果与分析
  • 5.6 本章小结
  • 第六章 基于混淆网络和SVM的语音识别错误纠正
  • 6.1 引言
  • 6.1.1 语音错误纠正方法简介
  • 6.1.2 基于分而治之思想的语音识别错误纠正方案
  • 6.2 SVM理论
  • 6.3 基于SVM语音确认算法介绍
  • 6.4 基于码本映射的SVM语音确认方法
  • 6.4.1 矢量量化(VQ)
  • 6.4.2 利用码本进行语音序列定长映射
  • 6.4.3 特征向量归一化
  • 6.5 实验设定与结果
  • 6.6 本章小结
  • 第七章 总结与展望
  • 7.1 论文总结
  • 7.2 研究展望
  • 参考文献
  • 博士期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].Sounds of Aa and Ii[J]. 中国多媒体与网络教学学报(电子版) 2017(04)
    • [2].用趣味教学帮助学生顺利闯过语音关[J]. 英语画刊(高级版) 2019(29)
    • [3].五年制初中起点的英语教学如何过好语音关[J]. 中国科教创新导刊 2013(03)
    • [4].在教学中如何培养学生的独立意识[J]. 语文教学与研究 2011(17)
    • [5].严把单词语音关,提高乡镇小学英语教学效率[J]. 学周刊 2015(04)
    • [6].语音关键词检测中置信测度方法研究综述[J]. 智能计算机与应用 2014(02)
    • [7].语音关键词识别系统声学模型构建综述[J]. 燕山大学学报 2017(06)
    • [8].基于音素后验概率的样例语音关键词检测方法[J]. 天津大学学报(自然科学与工程技术版) 2015(09)
    • [9].一种改进的语音关键词特征提取方法[J]. 上海电机学院学报 2008(04)
    • [10].基于音素混淆网络的蒙古语语音关键词检测方法的研究[J]. 中文信息学报 2015(01)
    • [11].一种基于互补声学模型的多系统融合语音关键词检测方法[J]. 自动化学报 2009(01)
    • [12].英语听说能力的培养[J]. 中学英语园地(教研版) 2011(09)
    • [13].基于词干的蒙古语语音关键词检测方法的研究[J]. 中文信息学报 2016(01)
    • [14].汉字语音关联对错误记忆的影响[J]. 心理学报 2010(02)
    • [15].低资源语言的无监督语音关键词检测技术综述[J]. 中国图象图形学报 2015(02)
    • [16].一种基于语音关键词识别的广播电视内容监测系统[J]. 广播与电视技术 2009(12)
    • [17].采用词图相交融合的语音关键词检测方法[J]. 信号处理 2015(06)
    • [18].如何搞好英语新授课教学[J]. 新作文(教育教学研究) 2011(20)
    • [19].家电控制系统的语音关键词识别算法研究[J]. 电声技术 2008(04)
    • [20].初中英语课堂教学探究[J]. 发展 2013(01)
    • [21].提高初中生英语口语表达能力之我见[J]. 新课程(中学) 2012(06)
    • [22].口语教学的探讨与实践[J]. 文学教育(下) 2015(07)
    • [23].过好语音关提高学生英语水平——少数民族地区五年制师范非英语专业学生英语发音问题探究[J]. 成才之路 2013(25)
    • [24].浅谈农村初中英语口语教学[J]. 亚太教育 2016(32)
    • [25].学习Phonics,开展阅读教学的实践[J]. 小学教学参考 2012(30)
    • [26].提高学生听力方法之我见[J]. 群文天地 2012(21)
    • [27].英语语音教学难点的探索与思考[J]. 辽宁教育 2010(06)
    • [28].浅谈英语口语能力的培养[J]. 新课程(中学) 2010(05)
    • [29].三步走,提升英语口语表达能力[J]. 语数外学习(初中版) 2018(10)
    • [30].初中英语课堂教学的实践与探索[J]. 考试周刊 2015(53)

    标签:;  ;  ;  ;  ;  

    语音关键词识别技术的研究
    下载Doc文档

    猜你喜欢