汉语连续语音声韵母类别属性检测技术研究

汉语连续语音声韵母类别属性检测技术研究

论文摘要

基于隐马尔可夫模型(HMM)的语音识别是主流的大词汇量语音识别方法,但是该方法没有考虑人的思维认知过程,忽略了很多语音及语言学知识,目前发展遇到了瓶颈。因此,一个以知识为基础并结合统计模型的新型语音识别框架应运而生。而语音知识属性的获取以及如何运用语音知识属性是该框架亟待解决的关键问题。本文重点研究了汉语连续语音声韵母边界和类别知识属性的提取,并将其应用于汉语语音识别中,具体工作如下:提出了一种基于Seneff听觉谱特征的汉语连续语音声韵母边界检测方法。通过研究声韵母能量集中区域和共振峰结构的差异性,利用Seneff听觉谱能够很好的凸显语音信号中变化剧烈区域和共振峰结构等特点,构建基于Seneff听觉谱的优选特征参数集,并对各种特征参数的候选边界点进行融合,实现了对声韵母边界点的检测。与基于模型的方法相比较,该方法克服了训练数据量大、检测鲁棒性差的缺点;与以帧长为单位的方法相比较,该方法克服了分帧处理精度低和容易漏检的问题。实验结果表明,本文算法具有较高的边界检测准确率、精确度和较强的鲁棒性,且算法复杂度较低。提出了一种基于能量和共振峰结构信息的鼻音检测方法。根据语音能量值大小和共振峰结构上的差异将语音分为响音与阻塞音,并进一步对响音中的鼻音进行检测,在保证鼻音检测正确率的前提下,通过分析易与鼻音混淆音段在能量和共振峰结构的区别,采用后处理逐步去除插入错误,与经典算法相比较,提高了鼻音检测的准确率。提出了一种基于能量变化率的塞音检测方法。通过分析塞音的音段时长和能量变化过程,提取能量变化率参数进行塞音检测,克服了传统采用爆发谱特征方法不稳定、非塞音也可能存在爆发谱等缺点,提高了塞音检测的性能,最后通过交叉验证得知本文方法具有较好的稳定性和泛化性能。提出了一种基于音段能量分布特性和谱统计量的塞擦音和摩擦音分类方法。通过分析非塞音中塞擦音和摩擦音发音过程及谱形状上的差异,提取音段能量分布特征和谱统计量参数,实现了塞擦音和摩擦音的分类,实验证明了该方法的有效性。最后,结合前面提出的声韵母边界检测和多种类别检测方法,采用二叉树的形式,实现了对汉语连续语音声韵母边界和类别知识属性的检测。并将其应用到基于分段条件随机场整合模型的连续语音识别基线系统中。实验结果表明,本文方法检测得到的声韵母边界和类别知识属性,能够有效提高基线系统的性能。

论文目录

  • 表目录
  • 图目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 语音识别技术的发展历程
  • 1.2 下一代语音识别系统
  • 1.3 下一代语音识别系统的研究现状
  • 1.3.1 语音知识属性的检测
  • 1.3.2 语音知识属性的整合
  • 1.4 论文的主要工作和组织安排
  • 1.4.1 论文的主要工作
  • 1.4.2 论文的结构安排
  • 第二章 基于Seneff 听觉谱特征的汉语连续语音声韵母边界检测
  • 2.1 引言
  • 2.2 Seneff 听觉感知模型
  • 2.3 基于听觉感知模型的声韵母边界特征参数表示
  • 2.3.1 Seneff 听觉谱频带的划分
  • 2.3.2 基于听觉谱特征参数的静音段去除
  • 2.3.3 基于听觉谱的声韵母边界特征参数选取
  • 2.3.4 特征参数的平滑
  • 2.3.5 特征参数突变点的确定
  • 2.4 声韵母边界检测
  • 2.5 实验及结果分析
  • 2.5.1 实验语料
  • 2.5.2 评估指标
  • 2.5.3 实验结果
  • 2.6 小结
  • 第三章 基于能量和共振峰结构信息的响音检测分类
  • 3.1 响音与阻塞音的分类
  • 3.2 基于能量和共振峰结构信息的鼻音检测
  • 3.2.1 基于听觉谱的能量和共振峰结构信息特征参数选取
  • 3.2.2 基于谱特征的鼻音检测
  • 3.3 鼻音检测结果的后处理
  • 3.4 测试评估
  • 3.4.1 实验语料及评估指标
  • 3.4.2 实验结果及分析
  • 3.5 小结
  • 第四章 基于发音过程特性的阻塞音检测分类
  • 4.1 基于能量变化率的塞音检测
  • 4.1.1 基于听觉谱的能量变化参数选取
  • 4.1.2 特征参数变换
  • 4.1.3 基于KNN 的塞音分类
  • 4.2 塞音检测实验及结果分析
  • 4.2.1 实验语料
  • 4.2.2 实验结果
  • 4.2.3 模型的交叉验证
  • 4.3 基于音段能量分布特性和谱统计量的非塞音分类
  • 4.3.1 基于听觉谱的音段能量分布特性和谱统计量参数选取
  • 4.3.2 非塞音分类实验及结果分析
  • 4.4 汉语连续语音声韵母类别检测混淆矩阵
  • 4.5 小结
  • 第五章 声韵母边界和类别属性在语音识别中的应用
  • 5.1 基于统计模型的语音识别
  • 5.2 基于属性检测的语音识别
  • 5.3 基于SCRF 模型的语音识别
  • 5.3.1 SCRF 模型的基本理论
  • 5.3.2 特征构建
  • 5.4 测试评估
  • 5.4.1 实验准备
  • 5.4.2 基于SCRF 模型识别器的构建
  • 5.4.3 实验结果
  • 5.5 小结
  • 结束语
  • 一、论文工作总结
  • 二、前景和展望
  • 参考文献
  • 作者简历 攻读硕士学位期间完成的主要工作
  • 致谢
  • 相关论文文献

    • [1].基于特定韵母发音事件分析的语音唇动一致性判决方法[J]. 华南理工大学学报(自然科学版) 2020(01)
    • [2].山西宁武方言韵母系统内部差异特征及分布[J]. 兴义民族师范学院学报 2020(01)
    • [3].基于音位归纳的视角谈对韩韵母教学——以声学数据为佐证[J]. 东疆学刊 2020(02)
    • [4].小龄功能性构音障碍儿童韵母音位对发音状况研究[J]. 听力学及言语疾病杂志 2020(04)
    • [5].音节环境对韵母时长的影响[J]. 语文学刊 2012(21)
    • [6].来语中的嘎裂发声态韵母[J]. 民族语文 2013(06)
    • [7].浅谈韵母的教学[J]. 新课程(中) 2011(08)
    • [8].非洲留学生初级阶段汉语听力声、韵母障碍研究[J]. 林区教学 2010(09)
    • [9].学龄前正常和智障儿童韵母发音能力的比较[J]. 学前教育研究 2016(12)
    • [10].基于鼻韵尾分离的汉语声韵母识别模型[J]. 声学学报 2010(05)
    • [11].湖南武冈方言中的韵母重叠现象[J]. 中国语文 2017(01)
    • [12].浅谈韵母的内部结构分析[J]. 北方文学 2018(27)
    • [13].和儿子一起学习[J]. 黄河.黄土.黄种人 2015(11)
    • [14].梨园戏韵母系统中的“鹧鸪音”研究[J]. 宁夏大学学报(人文社会科学版) 2012(06)
    • [15].《合并字学篇韵便览》韵母系统的几个问题[J]. 宁夏大学学报(人文社会科学版) 2010(02)
    • [16].带鼻音韵母教学的问题与对策[J]. 科教文汇(中旬刊) 2009(12)
    • [17].声韵母约束扩展识别网络的发音偏误检测[J]. 信号处理 2020(06)
    • [18].浅谈韵母发音练习要点[J]. 中国培训 2016(20)
    • [19].基于声韵母的汉语语音识别[J]. 通信电源技术 2014(06)
    • [20].单韵母宝宝扛声调[J]. 万象 2019(07)
    • [21].愁眉舒展了[J]. 小学生学习指导 2018(27)
    • [22].相同的韵母(组诗节选)[J]. 诗歌月刊 2014(09)
    • [23].浅谈韵母o的读音[J]. 汉字文化 2014(05)
    • [24].福安话韵母的历史音变及其共时分析方法[J]. 中国语文 2012(01)
    • [25].藤县话i尾复韵母的音变[J]. 广西教育学院学报 2011(01)
    • [26].近两百年前的宁波方言韵母系统及其演变特征[J]. 古汉语研究 2019(02)
    • [27].歌唱中对韵母发音的处理原则[J]. 戏剧之家 2017(09)
    • [28].赣语韵母的“弇侈同韵”及其类型学解释[J]. 语言研究 2015(04)
    • [29].“娃”“贝”理韵识字[J]. 小学教学(语文版) 2020(05)
    • [30].广东化州那务话韵母的特点[J]. 现代语文(语言研究版) 2015(02)

    标签:;  ;  

    汉语连续语音声韵母类别属性检测技术研究
    下载Doc文档

    猜你喜欢