论文摘要
基于大语料库的拼接合成由于其合成的语音清晰自然,而得到了广泛的应用。由于汉语语音合成中自动切分的精度将直接影响到语料库中基元的质量,进而直接影响到合成出的语音的质量,因此自动切分技术已经成为了汉语语音合成中的一个重要课题。在自动切分技术的研究中,作者详细地调查了自动切分的研究现状。根据研究现状,采取了目前较主流的基于隐马尔科夫模型的强制对齐的方法用于自动切分基线系统的构建中。在自动切分基线系统的构建中,作者提出了一种新的模型参数自适应方法,结果证明可以较大程度地提高自动切分的精度。作者还做了大量的实验来验证相关的语音参数在自动切分中的效果,大多数参数的挑选都被同类论文忽视,但在实际系统中却有着重要的影响。在现有的自动切分技术中,大多数研究都是基于单一模型,上下文相关或上下文无关的模型。采用单一模型内在的问题是每个边界单元只有一个模型预测的时间值,而没有考虑不同的模型对于相同声学环境下的边界的不同的作用。作者在论文中提出了以下两种方法来找到处于类似声学环境下的边界与不同模型之间的映射规则,进一步用映射规则来为每个边界找到最合适的模型。第一,利用混合模型进行汉语语音合成库的自动切分技术。所有的边界单元按照其所处的声学环境被分为十一组。在这些边界组中,将利用混合模型训练得到边界组与声韵母单音子模型(IFMM)、半音节单音子模型(SSMM)。声韵母三音子模型(IFTM)之间的映射规则。第二,使用C4.5决策树分类的算法,来训练处于相似声学环境下的边界与IFMM、SSMM和IFTM之间的映射规则,通过映射规则,为每个边界单元选取最合适的模型预测时间值。在决策树的构建过程中,问题集的选取和属性的挑选至关重要。在论文中,作者给出了自动切分中,选取问题集的方法,并给出了遗传算法和C4.5决策树默认的算法来进行属性挑选。实验结果显示,在切分精度和边界的偏移上,利用混合模型和决策树分类两种方法都取得了比单一模型进行汉语语音合成库的自动切分技术更好的结果。
论文目录
摘要ABSTRACT第一章 语音合成概述1.1 研究意义1.2 语音合成基本原理1.2.1 基于参数的合成技术1.2.2 基于波形拼接的合成技术1.3 语音合成应用现状第二章 自动切分系统概述及基线系统的建立2.1 自动切分系统概述2.1.1 什么是自动切分2.1.2 汉语文语转换系统中研究自动切分系统的必要性2.2 自动切分系统的研究现状2.2.1 研究语言的分布2.2.2 研究时间的分布2.2.3 研究机构的分布2.3 自动切分基本原理2.4 自动切分的评价方式第三章 基于HMM的强制对齐3.1 HMM模型的训练3.1.1 HMM的模型定义3.1.2 HMM模型训练算法3.1.3 HMM训练策略3.3 模型参数自适应3.4 强制对齐第四章 汉语文语转化系统中自动切分基线系统的构建4.1 语音库的正则化4.1.1 语音库描述4.1.2 语音库的正则化过程4.2 感知线性预测系数(PLP)参数求解过程4.3 模型训练和自适应4.3.1 说话人无关的模型训练4.3.2 模型的自适应4.3.3 加入人工标注的训练数据进行自适应4.3.4 停顿模型的训练4.3.5 模型训练和自适应后性能的提高4.4 用能量确定语句起始的静音4.5 调整帧移输出的位置4.6 语音参数配置4.6.1 IF和IFB的定义4.6.2 PLP参数配置4.6.3 帧移参数配置4.6.4 MLLR和MAP4.6.5 参数配置4.7 基线系统的性能第五章 利用混合模型训练映射规则5.1 边界分组5.2 语音合成库在每组中的分布5.3 利用混合模型方法训练映射规则5.4 利用混合模型进行自动切分的实验第六章 利用决策树训练映射规则6.1 决策树C4.5算法介绍6.1.1 决策树算法6.1.2 C4.5决策树算法6.2 利用决策树分类进行自动切分的流程6.3 自动切分中决策树的构建6.3.1 问题集的选取6.3.2 映射规则训练流程6.4 利用遗传算法进行属性挑选6.4.1. 算法中所用到各种进化和遗传学的概念6.4.2. 遗传算法的原理6.4.3 遗传算法的步骤和意义6.4.4. 用遗传算法进行属性挑选6.5 利用决策树分类进行自动切分的实验6.6 性能比较第七章 总结与展望参考文献附录致谢作者攻读学位期间发表的学术论文目录
相关论文文献
标签:语音合成论文; 自动切分论文; 混合模型论文; 决策树论文;