基于CART预选的大语料库语音合成系统研究

论文摘要

语音合成技术在当今是个前沿和热门的课题,本文针对语音合成系统中的语料预选开展研究,针对语料预选的特点,将CART决策树理论应用于预选过程,提出了基于二进制位的数据表示方法来表示预选规则,并用其设计实现了语料预选树,最终应用生成的预选树设计实现了一个语音合成系统,合成出了较为自然流利的语音。基于语料库的语音合成方法是未来一段时间合成自然语音的最重要方式。语料预选是基于语料库语音合成的一个重要课题,本文将CART决策树算法应用于语料预选,并通过实验检验其效果。本文提出了基于二进制位的数据表示方法,并将其应用于预选树规则的表示。本文提出的基于二进制位的数据表示方法可以便捷的表示集合和其子集,采用决策树算法的预选树实际就是用其规则不断分割数据,直到找到对应的分类,通过运用基于二进制位的数据表示方法,在进行判定时可以采用一系列的逻辑位运算来实现,远比一般的匹配类别算法快捷。针对采用简单问题对多维数据分类可能造成的被分类数据过度片断化问题,本文研究了采用复合问题集将简单问题分类结果进行优化的方法。论文对语料库的数据进行了分析统计处理,具体设计了程序TTS TRAIN实现语料预选树的创建,并根据最小复合代价原则对预选树进行了评估剪枝。在基于CART语料预选树的语音合成系统实现中,本文给出了语音合成系统的结构和模块构成。本文设计了汉字区位码、拼音和预选树的索引对照文件以解决由汉字到拼音和预选树快速查询。论文应用海量分词软件划分语法词层,采用了人工标注方法训练C4.5决策树,并用C4.5算法实现了韵律层级标注。用语料预选树进行了语料的预选,并应用Viterbi算法对语料进行了最终的选择。通过设计实验得出本文实现的语音合成系统的语音合成质量为可以接受到较好。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 引言

1.2 语音合成技术研究现状及发展趋势

1.2.1 研究现状

1.2.2 发展趋势

1.3 课题研究任务

1.4 论文内容安排

第二章语音合成技术概述

2.1 语音合成的基本原理

2.2 典型的语音合成方法

2.2.1 共振峰合成法

2.2.2 LPC 参数合成法

2.2.3 PSOLA 合成法

2.3 基于语料库的语音合成

2.4 CART 算法的基本原理

2.5 本章小结

第三章语料预选树的设计与实现

3.1 预选数据的预处理

3.1.1 TH-CoSS 语料库介绍

3.1.2 获取语音基元信息

3.1.3 转化数据格式

3.2 预选规则的选择方法

3.2.1 预选树的预选规则

3.2.2 离散数据分割准则的选择

3.2.3 连续数据分割准则的选择

3.3 预选规则的二进制表示

3.3.1 基于二进制位的数据表示

3.3.2 简单预选规则的表示

3.3.3 复合预选规则的表示

3.4 语料预选树的整体实现

3.4.1 初始化

3.4.2 创建生成树

3.4.3 评估剪枝

3.4.4 存储预选树

3.4.5 软件运行结果

3.5 本章小结

第四章语音合成系统的设计与实现

4.1 系统功能定义及平台选用

4.1.1 系统的功能模块

4.1.2 开发环境和开发语言

4.2 文本处理模块

4.2.1 构建快速索引

4.2.2 标注文本韵律层级

4.3 语料选择模块

4.3.1 语料树预选的实现

4.3.2 语料精选的实现

4.4 系统测试和评价

4.5 本章小结

第五章结束语

致谢

参考文献

作者在学期间取得的学术成果

基于CART预选的大语料库语音合成系统研究

论文摘要

论文目录

相关论文文献

猜你喜欢