维吾尔语连续语音流中音素的自动切分算法研究与实现

维吾尔语连续语音流中音素的自动切分算法研究与实现

论文摘要

语料库的建设是语音信息处理的基础工作,其中除了在语料收集和录音等方面做大量工作外,做准确的标注也是建立完善语料库的必要工作,因为这直接影响语音处理工作的结果。本文就以建立维吾尔语音语料库为目的,为了减少人工工作量,提高标注准确率,结合维吾尔语语音特征,通过HTK工具实现了基于单音素HMM模型的自动切分算法和基于三音素HMM模型的自动切分算法。其中完成了文本设计、录音、手动标注、音素列表的确定、上下文属性集与问题集的设计、带时间标注文件与不带时间的上下文相关标注文件的生成等数据准备工作;研究HMM和HTK的用法,配置适合维吾尔语音素级自动切分的HMM拓扑结构,通过训练得到单音素模型和三音素模型,对任意输入的语音句子自动切分,最后分析了两种算法的切分准确度、存在的问题及对策等。实验结果证明基于三音素HMM模型的自动切分准确率高于基于单音素模型的自动切分准确率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究背景及意义
  • 1.1.1 课题背景
  • 1.1.2 研究意义
  • 1.2 语音自动切分技术的研究现状
  • 1.2.1 人工切分方法
  • 1.2.2 基于HMM 的自动切分方法
  • 1.2.3 基于DTW 的自动切分方法
  • 1.2.4 其他方法及总结
  • 1.3 本文的研究内容及安排
  • 第二章 语音自动切分的相关技术
  • 2.1 语音切分单元的选取
  • 2.2 模型训练和匹配技术
  • 2.3 HMM 简介
  • 2.3.1 HMM 基本概念
  • 2.3.2 HMM 的三个基本问题
  • 2.4 HTK 工具简介
  • 第三章 维吾尔语连续语音流中音素的自动切分算法研究和实现
  • 3.1 维吾尔语语音学基础
  • 3.1.1 音素和音节
  • 3.1.2 元音和辅音
  • 3.2 维吾尔语语音自动切分基元的选取
  • 3.3 数据准备
  • 3.3.1 文本语料的收集与挑选
  • 3.3.2 语音语料的设计与录音
  • 3.4 基于单音素HMM 模型的音素自动切分算法
  • 3.4.1 自动切分流程
  • 3.4.2 模型参数配置
  • 3.4.3 音素列表的确定
  • 3.4.4 带时间的标注文件
  • 3.4.5 单音素模型的初始化和训练
  • 3.4.6 音素自动切分
  • 3.5 基于三音素HMM 模型的音素自动切分算法
  • 3.5.1 自动切分流程
  • 3.5.2 上下文属性的设计
  • 3.5.3 问题集的设计
  • 3.5.4 不带时间的上下文相关标注文件
  • 3.5.5 上下文相关模型的训练
  • 3.5.6 音素自动切分
  • 第四章 实验结果与分析
  • 4.1 实验结果
  • 4.2 存在的问题及其对策
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 在研期间发表论文及参与课题
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    维吾尔语连续语音流中音素的自动切分算法研究与实现
    下载Doc文档

    猜你喜欢