论文摘要
对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影响。传统的切分或标注语音库的方法是靠人工手工完成,这种方式不但工作效率很低、工作量太大,而且切分数据的准确性也得不到保证,所以一种能够自动、准确切分或标注语音库的方法显得特别有意义和研究价值。在近几年使用隐马尔可夫模型的语音识别已经成为主导,从已经发表的相关论文的数量和在重要的语音会议上所作的讲座的数量就可以证明。此方法之所以如此受欢迎,其原因有以下几点,一是其内在的统计的(数学上准确)框架,二是从有限的训练集语音数据估计出模型参数的训练算法的易用性和可用性,三是结果识别系统的灵活性,可以改变模型的大小、类型或者结构来配合特殊的话语、声音等等,最后是整个识别系统实现的简单性。本文通过对隐马尔可夫模型的研究,提出了汉语连续语音音节自动切分的方法。这种音节自动标注算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在本文中也将此方法与采用其它技术实现的自动标注方法进行对比,在本文中所实现的其它技术包括基于归并的音节切分自动机,最大熵模型。在连续语音上的切分实验结果说明这种基于HMM的音节自动标注算法是准确而可靠的。
论文目录
摘要Abstract第1章 绪论1.1 研究的背景和意义1.2 语音库自动标注技术国内外研究现状1.2.1 国外研究现状1.2.2 国内研究现状1.2.3 国内外研究现状总结1.3 相关技术概述1.3.1 语音信号处理1.3.2 声学模型训练1.4 本文的主要研究内容和结构安排第2章 语音信号预处理及特征参数提取2.1 引言2.2 语音信号预处理2.2.1 语音信号的模数转换和滤波2.2.2 语音信号的预加重2.2.3 语音信号的分帧和加窗2.3 连续语音信号端点检测2.3.1 端点检测概述2.3.2 预处理阶段2.3.3 短时能量算法2.3.4 短时过零率算法2.3.5 短时能量/过零率算法2.3.6 端点检测小结2.4 常用典型语音信号声学特征2.4.1 时域参数2.4.2 倒谱参数2.5 本章小结第3章 基于HMM 的自动切分3.1 引言3.2 HMM 的基本知识3.2.1 HMM 的定义及其基本概念3.2.2 HMM 的三个基本问题3.2.3 HMM 的结构和类型3.3 语音特征参数的选择3.4 声学模型训练3.4.1 引言3.4.2 训练过程3.5 关键参数对自动切分准确性的影响3.6 本章小结第4章 基于归并和基于最大熵自动切分方法的实现4.1 引言4.2 基于归并的音节切分自动机4.2.1 特征参数的提取4.2.2 相近语音帧的归并4.2.3 音节切分自动机的实现4.2.4 自动机的输出和音节切分4.2.5 切分段所含单音节个数范围估计4.3 基于最大熵方法的音节自动切分4.3.1 最大熵方法概述4.3.2 最大熵模型的理论推导4.3.3 模型选择和优化方法4.3.4 应用最大熵模型构建自动切分系统第5章 实验及实验结果分析5.1 引言5.2 实验环境5.3 实验数据5.4 三种算法的实现及结果5.4.1 基于HMM 的音节自动切分5.4.2 基于归并的音节切分自动机5.4.3 基于最大熵模型的自动切分程序5.5 实验和结果分析结论参考文献致谢附录
相关论文文献
标签:语音识别论文; 语音语料库论文; 最大熵论文; 音节自动标注论文;