汉语连续语音的音节自动标注算法研究及实现

汉语连续语音的音节自动标注算法研究及实现

论文摘要

对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影响。传统的切分或标注语音库的方法是靠人工手工完成,这种方式不但工作效率很低、工作量太大,而且切分数据的准确性也得不到保证,所以一种能够自动、准确切分或标注语音库的方法显得特别有意义和研究价值。在近几年使用隐马尔可夫模型的语音识别已经成为主导,从已经发表的相关论文的数量和在重要的语音会议上所作的讲座的数量就可以证明。此方法之所以如此受欢迎,其原因有以下几点,一是其内在的统计的(数学上准确)框架,二是从有限的训练集语音数据估计出模型参数的训练算法的易用性和可用性,三是结果识别系统的灵活性,可以改变模型的大小、类型或者结构来配合特殊的话语、声音等等,最后是整个识别系统实现的简单性。本文通过对隐马尔可夫模型的研究,提出了汉语连续语音音节自动切分的方法。这种音节自动标注算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在本文中也将此方法与采用其它技术实现的自动标注方法进行对比,在本文中所实现的其它技术包括基于归并的音节切分自动机,最大熵模型。在连续语音上的切分实验结果说明这种基于HMM的音节自动标注算法是准确而可靠的。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究的背景和意义
  • 1.2 语音库自动标注技术国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.2.3 国内外研究现状总结
  • 1.3 相关技术概述
  • 1.3.1 语音信号处理
  • 1.3.2 声学模型训练
  • 1.4 本文的主要研究内容和结构安排
  • 第2章 语音信号预处理及特征参数提取
  • 2.1 引言
  • 2.2 语音信号预处理
  • 2.2.1 语音信号的模数转换和滤波
  • 2.2.2 语音信号的预加重
  • 2.2.3 语音信号的分帧和加窗
  • 2.3 连续语音信号端点检测
  • 2.3.1 端点检测概述
  • 2.3.2 预处理阶段
  • 2.3.3 短时能量算法
  • 2.3.4 短时过零率算法
  • 2.3.5 短时能量/过零率算法
  • 2.3.6 端点检测小结
  • 2.4 常用典型语音信号声学特征
  • 2.4.1 时域参数
  • 2.4.2 倒谱参数
  • 2.5 本章小结
  • 第3章 基于HMM 的自动切分
  • 3.1 引言
  • 3.2 HMM 的基本知识
  • 3.2.1 HMM 的定义及其基本概念
  • 3.2.2 HMM 的三个基本问题
  • 3.2.3 HMM 的结构和类型
  • 3.3 语音特征参数的选择
  • 3.4 声学模型训练
  • 3.4.1 引言
  • 3.4.2 训练过程
  • 3.5 关键参数对自动切分准确性的影响
  • 3.6 本章小结
  • 第4章 基于归并和基于最大熵自动切分方法的实现
  • 4.1 引言
  • 4.2 基于归并的音节切分自动机
  • 4.2.1 特征参数的提取
  • 4.2.2 相近语音帧的归并
  • 4.2.3 音节切分自动机的实现
  • 4.2.4 自动机的输出和音节切分
  • 4.2.5 切分段所含单音节个数范围估计
  • 4.3 基于最大熵方法的音节自动切分
  • 4.3.1 最大熵方法概述
  • 4.3.2 最大熵模型的理论推导
  • 4.3.3 模型选择和优化方法
  • 4.3.4 应用最大熵模型构建自动切分系统
  • 第5章 实验及实验结果分析
  • 5.1 引言
  • 5.2 实验环境
  • 5.3 实验数据
  • 5.4 三种算法的实现及结果
  • 5.4.1 基于HMM 的音节自动切分
  • 5.4.2 基于归并的音节切分自动机
  • 5.4.3 基于最大熵模型的自动切分程序
  • 5.5 实验和结果分析
  • 结论
  • 参考文献
  • 致谢
  • 附录
  • 相关论文文献

    标签:;  ;  ;  ;  

    汉语连续语音的音节自动标注算法研究及实现
    下载Doc文档

    猜你喜欢