论文摘要
语料库的建设是语音信息处理的基础工作,其中除了在语料收集和录音等方面做大量工作外,做准确的标注也是建立完善语料库的必要工作,因为这直接影响语音处理工作的结果。本文就以建立维吾尔语音语料库为目的,为了减少人工工作量,提高标注准确率,结合维吾尔语语音特征,通过HTK工具实现了基于单音素HMM模型的自动切分算法和基于三音素HMM模型的自动切分算法。其中完成了文本设计、录音、手动标注、音素列表的确定、上下文属性集与问题集的设计、带时间标注文件与不带时间的上下文相关标注文件的生成等数据准备工作;研究HMM和HTK的用法,配置适合维吾尔语音素级自动切分的HMM拓扑结构,通过训练得到单音素模型和三音素模型,对任意输入的语音句子自动切分,最后分析了两种算法的切分准确度、存在的问题及对策等。实验结果证明基于三音素HMM模型的自动切分准确率高于基于单音素模型的自动切分准确率。
论文目录
摘要Abstract第一章 绪论1.1 课题研究背景及意义1.1.1 课题背景1.1.2 研究意义1.2 语音自动切分技术的研究现状1.2.1 人工切分方法1.2.2 基于HMM 的自动切分方法1.2.3 基于DTW 的自动切分方法1.2.4 其他方法及总结1.3 本文的研究内容及安排第二章 语音自动切分的相关技术2.1 语音切分单元的选取2.2 模型训练和匹配技术2.3 HMM 简介2.3.1 HMM 基本概念2.3.2 HMM 的三个基本问题2.4 HTK 工具简介第三章 维吾尔语连续语音流中音素的自动切分算法研究和实现3.1 维吾尔语语音学基础3.1.1 音素和音节3.1.2 元音和辅音3.2 维吾尔语语音自动切分基元的选取3.3 数据准备3.3.1 文本语料的收集与挑选3.3.2 语音语料的设计与录音3.4 基于单音素HMM 模型的音素自动切分算法3.4.1 自动切分流程3.4.2 模型参数配置3.4.3 音素列表的确定3.4.4 带时间的标注文件3.4.5 单音素模型的初始化和训练3.4.6 音素自动切分3.5 基于三音素HMM 模型的音素自动切分算法3.5.1 自动切分流程3.5.2 上下文属性的设计3.5.3 问题集的设计3.5.4 不带时间的上下文相关标注文件3.5.5 上下文相关模型的训练3.5.6 音素自动切分第四章 实验结果与分析4.1 实验结果4.2 存在的问题及其对策第五章 总结与展望5.1 总结5.2 展望参考文献在研期间发表论文及参与课题致谢
相关论文文献
标签:维吾尔语论文; 语音语料库论文; 自动切分论文;