基于词干词缀的有限条词的蒙古语语音合成系统的研究

论文摘要

语音合成技术是将计算机自己产生的或从外部输入的文字、符号、数字等信息转换成自然流畅的语音信号输出，这种技术又称文语转换技术（Text to Speech，简称TTS），它涉及到计算机技术、语言学、语音学、语音信号处理、心理学等多个研究领域。蒙古语是内蒙古自治区的官方语言，在全国范围内有六百万的蒙古族在日常生活和文化交流中使用着蒙古语。所以，研究和实现蒙古语语音合成技术对蒙古语信息化处理是非常有意义的。在本论文中，我们主要探讨了如何根据蒙古语的语言、语音特征，建立一个具有一定自然度的、适用范围广泛的语音合成系统。我们所做的主要工作集中在以下几个方面：1、我们在分析蒙古语语音特征基础上，选择蒙古语的词干词缀作为该语音合成系统的合成基元。根据蒙古语的构词法规则，从大量的语料中总结出蒙古语的构形词缀。并解决了文本分析过程中的词干词缀的切分，从而在语音数据库中进行检索，找到对应的语音数据。2、通过对自然语流中的语音韵律参数的统计、分析，总结了蒙古语中的韵律变化规则。其中包括时长变化规则，重音变化规则，停顿规则和蒙古语中语气与韵律的关系。3、采用时域基音同步叠加（TD-PSOLA）算法和频域基音同步叠加法（FD-PSOLA）算法相结合，实现合成语音的韵律调整，很大程度的提高了蒙古语合成语音的自然度。同时在拼接算法的选择上我们采用了软拼接和硬拼接相结合的算法，以便达到更好的合成效果。

论文目录

摘要

ABSTRACT

图表目录

第一章序言

1.1 语音技术

1.2 语音合成技术简介

1.3 语音合成技术的国内外研究现状

1.4 语音合成的发展方向

1.5 本文的研究任务和方法

1.6 本课题研究的意义

第二章基于波形拼接的语音合成系统

2.1 系统总体框架

2.1.1 文本分析模块

2.1.2 韵律生成模块

2.1.3 语音生成模块

2.2 语音合成方法简介

2.3 本系统研究思路

第三章基于TD-PSOLA和FD-PSOLA相结合进行韵律调整

3.1 PSOLA算法简介

3.1.1 TD-PSOLA

3.1.2 FD-PSOLA

3.1.3 LP-PSOLA

3.2 基于TD-PSOLA和FD-PSOLA相结合的韵律调整

3.2.1 时长的调整

3.2.2 基频的调整

3.2.3 TD-PSOLA和FD-PSOLA相结合进行韵律调整

3.2.4 振幅的调整

3.3 PSOLA算法对合成语音质量影响的讨论

第四章基音检测算法

4.1 各种提取算法简介

4.1.1 短时自相关函数法

4.1.2 短时平均幅度差函数法（AMDF法）

4.1.3 小波变换法

4.2 本论文基音检测的实现过程

第五章蒙古语语音音段和韵律特征分析

5.1 蒙古语的语言、语音特征

5.1.1 蒙古文特点

5.1.2 蒙古语语音学

5.2 蒙古语语音的韵律模型及表示方法

5.2.1 时长的变化规则

5.2.2 重音的变化规则

5.2.3 语调变化规则

5.2.4 停顿规则

5.3 多样板的韵律模型

第六章基于词干词缀的蒙古语语音库建设

6.1 选择词干词缀为语音合成基元的理论基础

6.2 语音语料的收集及语音库的录制

6.2.1 常用蒙古语整词的收集和蒙古语构形词缀的收集

6.2.2 语音语料库的表结构

6.2.3 建立语音库时切分语音单元的注意事项

6.3 语音库的结构

第七章蒙古语语音合成系统的实现

7.1 文本分析模块的实现

7.2 韵律生成模块的实现

7.3 语音音段的拼接

7.4 系统的性能测试

7.5 其他相关技术问题及实现

第八章总结与展望

8.1 工作总结

8.2 未来展望

致谢

参考文献

基于词干词缀的有限条词的蒙古语语音合成系统的研究

论文摘要

论文目录

相关论文文献

猜你喜欢