论文摘要
语音合成技术是将计算机自己产生的或从外部输入的文字、符号、数字等信息转换成自然流畅的语音信号输出,这种技术又称文语转换技术(Text to Speech,简称TTS),它涉及到计算机技术、语言学、语音学、语音信号处理、心理学等多个研究领域。蒙古语是内蒙古自治区的官方语言,在全国范围内有六百万的蒙古族在日常生活和文化交流中使用着蒙古语。所以,研究和实现蒙古语语音合成技术对蒙古语信息化处理是非常有意义的。在本论文中,我们主要探讨了如何根据蒙古语的语言、语音特征,建立一个具有一定自然度的、适用范围广泛的语音合成系统。我们所做的主要工作集中在以下几个方面:1、我们在分析蒙古语语音特征基础上,选择蒙古语的词干词缀作为该语音合成系统的合成基元。根据蒙古语的构词法规则,从大量的语料中总结出蒙古语的构形词缀。并解决了文本分析过程中的词干词缀的切分,从而在语音数据库中进行检索,找到对应的语音数据。2、通过对自然语流中的语音韵律参数的统计、分析,总结了蒙古语中的韵律变化规则。其中包括时长变化规则,重音变化规则,停顿规则和蒙古语中语气与韵律的关系。3、采用时域基音同步叠加(TD-PSOLA)算法和频域基音同步叠加法(FD-PSOLA)算法相结合,实现合成语音的韵律调整,很大程度的提高了蒙古语合成语音的自然度。同时在拼接算法的选择上我们采用了软拼接和硬拼接相结合的算法,以便达到更好的合成效果。
论文目录
摘要ABSTRACT目录图表目录第一章 序言1.1 语音技术1.2 语音合成技术简介1.3 语音合成技术的国内外研究现状1.4 语音合成的发展方向1.5 本文的研究任务和方法1.6 本课题研究的意义第二章 基于波形拼接的语音合成系统2.1 系统总体框架2.1.1 文本分析模块2.1.2 韵律生成模块2.1.3 语音生成模块2.2 语音合成方法简介2.3 本系统研究思路第三章 基于TD-PSOLA和FD-PSOLA相结合进行韵律调整3.1 PSOLA算法简介3.1.1 TD-PSOLA3.1.2 FD-PSOLA3.1.3 LP-PSOLA3.2 基于TD-PSOLA和FD-PSOLA相结合的韵律调整3.2.1 时长的调整3.2.2 基频的调整3.2.3 TD-PSOLA和FD-PSOLA相结合进行韵律调整3.2.4 振幅的调整3.3 PSOLA算法对合成语音质量影响的讨论第四章 基音检测算法4.1 各种提取算法简介4.1.1 短时自相关函数法4.1.2 短时平均幅度差函数法(AMDF法)4.1.3 小波变换法4.2 本论文基音检测的实现过程第五章 蒙古语语音音段和韵律特征分析5.1 蒙古语的语言、语音特征5.1.1 蒙古文特点5.1.2 蒙古语语音学5.2 蒙古语语音的韵律模型及表示方法5.2.1 时长的变化规则5.2.2 重音的变化规则5.2.3 语调变化规则5.2.4 停顿规则5.3 多样板的韵律模型第六章 基于词干词缀的蒙古语语音库建设6.1 选择词干词缀为语音合成基元的理论基础6.2 语音语料的收集及语音库的录制6.2.1 常用蒙古语整词的收集和蒙古语构形词缀的收集6.2.2 语音语料库的表结构6.2.3 建立语音库时切分语音单元的注意事项6.3 语音库的结构第七章 蒙古语语音合成系统的实现7.1 文本分析模块的实现7.2 韵律生成模块的实现7.3 语音音段的拼接7.4 系统的性能测试7.5 其他相关技术问题及实现第八章 总结与展望8.1 工作总结8.2 未来展望致谢参考文献
相关论文文献
标签:蒙古语言文字论文; 语音合成论文; 词干论文; 词缀论文;