汉语连续语音声调及数字串识别系统的研究

汉语连续语音声调及数字串识别系统的研究

论文摘要

语音识别在人机交互、通信、互联网和工业化控制等方面有着重要应用前景。声调是汉语音节的重要组成部分,具有构词辨意作用。汉语语音识别技术目前的研究热点和难点是非特定人的连续语音。随着语音识别技术的发展,声调识别研究成为其突破的方向之一。本文首先对声调提取算法进行研究。采用基于多参数组合方法(短时能量、短时过零率、自相关函数值)进行语音信号清浊音判别,利用循环平均幅度差函数进行基音周期计算。对所得声调曲线进行7维特征参数提取,利用隐马尔可夫模型建立汉语连续声调识别系统。系统正确识别率在训练集和测试集中分别为74.31%和71.37%,但声调三的识别率比较低。针对声调三识别率低的特点,本文对声调三音节的上下文语境进行实验研究。实验发现,当声调三音节为句尾或词尾时,其正确识别率为80%左右。考虑到音节的上下文语境和声调的特点,在声调识别系统中加入变调规则,搭建基于语境的声调识别系统。其识别率在训练集和测试集分别提高24.5%和21.1%,特别是声调三有显著提高。实验表明,基于上下文语境的声调识别系统的性能得到提升。本文最后对汉语连续数字串识别系统进行研究,实验发现存在容易误判的数字对,7(qi1)容易误判成4(si4),数字6(liu4)容易误判成9(jiu3)。考虑到声调具有辩意作用,在识别系统中加入声调识别模块,搭建基于声调信息的连续数字串识别系统。实验表明,改进后系统在训练集和测试集正确识别率为88.62%和83.36%,误判数字得到明显纠正,在连续数字串识别技术中加入声调信息能提高系统性能。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究背景
  • 1.2 国内外课题研究进展
  • 1.2.1 语音识别研究进展
  • 1.2.2 语音识别研究难点
  • 1.3 课题研究的目的及意义
  • 1.4 主要研究内容
  • 第2章 语音识别基础知识及相关技术
  • 2.1 语音识别基本概念
  • 2.1.1 语音识别系统构架
  • 2.1.2 语音识别关键技术
  • 2.2 隐马尔可夫模型
  • 2.3 语音信号预处理
  • 2.3.1 采样及量化
  • 2.3.2 预加重
  • 2.3.3 分帧与加窗
  • 2.3.4 端点检测
  • 2.4 本章小结
  • 第3章 连续语音声调识别系统建立与实验
  • 3.1 汉语连续语音声调识别原理
  • 3.2 声调提取
  • 3.2.1 音节分割
  • 3.2.2 基音周期计算
  • 3.2.3 平滑处理
  • 3.3 特征参数提取
  • 3.4 HMM 声调模型建立及实验
  • 3.4.1 采用HMM 算法的声调识别系统
  • 3.4.2 训练和识别仿真
  • 3.5 本章小结
  • 第4章 基于语境的声调识别系统建立与实验
  • 4.1 语境中的声调三识别
  • 4.2 上下文语境的HMM 声调模型建立与实验
  • 4.2.1 上下文语境的HMM 声调识别系统
  • 4.2.2 训练和识别仿真
  • 4.3 本章小结
  • 第5章 基于声调信息的连续数字串识别系统
  • 5.1 汉语连续数字串识别
  • 5.1.1 语料库
  • 5.1.2 训练和识别仿真
  • 5.2 误判数字对识别
  • 5.2.1 数字4 和7
  • 5.2.2 数字6 和9
  • 5.3 系统不足与展望
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    汉语连续语音声调及数字串识别系统的研究
    下载Doc文档

    猜你喜欢