汉语TTS中的韵律建模与合成方法研究

汉语TTS中的韵律建模与合成方法研究

论文摘要

随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统(Text-To-Speech,TTS)为研究重点。这是一种将输入的文本转换为语音输出的技术。TTS系统一般由文本分析、韵律控制、语音合成和基元库四个模块组成。这四个模块并不是相互孤立的,每一个模块的性能都对最终输出语音的质量有很大的影响。对合成系统输出语音音质的评价是多方面的,但主要集中在输出语音的清晰度,可懂度和自然度这三个方面。当前,TTS系统的输出语音在清晰度和可懂度方面已经达到了比较高的水平,而在语音的整体自然度方面还有待提高。本文主要研究了韵律控制和语音合成这两个模块,希望通过对这两个模块的研究与改进来提高合成语音的自然度。韵律控制模块对合成语音的自然度有很大的影响,对这部分的研究包括多个方面,这里选择韵律建模作为研究重点。韵律模型可以将一些定性的高层韵律信息转换为定量的声学参数,以便提供给后面的语音合成模块使用。本文运用人工神经网络技术设计并实现了一个用于预测汉语音节基频曲线、时长和停顿的模型。实验表明,这个模型在一定程度上能够较好的反映汉语陈述句中音节的基频曲线、时长和停顿的变化情况。语音合成模块负责最终语音的输出,现在普遍采用波形拼接技术。在选择最优的合成基元序列的同时,此模块也需要对其中一些语音波形做适当的修正,以使合成语音听上去更加流畅自然。本文在研究了最优基元选择算法的同时,也研究了一种基于傅立叶变换的语音频谱平滑算法。此算法能够较好的进行语音频谱平滑并且在一定程度上避免了传统算法使合成语音质量有较大下降的问题。为综合验证算法的性能,本文构建了一个简易的TTS系统,在其中采用了上面介绍的算法。听音测试表明,此系统的合成语音自然度较高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1.引言
  • 1.2.语音合成技术
  • 2.2.1.文本分析
  • 2.2.2.韵律控制
  • 2.2.3.语音合成
  • 2.2.4.基元库
  • 1.3.汉语普通话韵律
  • 1.4.研究目标和内容安排
  • 第二章 针对汉语音节的韵律建模
  • 2.1.韵律建模的意义
  • 2.2.韵律建模对象
  • 2.3.韵律建模的方法
  • 2.4.人工神经网络简介
  • 2.4.1.人工神经网络的结构
  • 2.4.2.人工神经网络的训练
  • 2.5.神经网络训练数据的提取
  • 2.5.1.人工神经网络的输入参数
  • 2.5.2.人工神经网络的输出参数
  • 2.6.实验结果
  • 第三章 语音合成方法研究
  • 3.1.语音合成模块的任务
  • 3.2.合成基元选择算法
  • 3.3.语音频谱平滑算法
  • 3.3.1.傅立叶变换与语音的频域表示
  • 3.3.2.算法步骤
  • 3.3.3.实验结果
  • 第四章 语音合成系统的构建以及对语音质量的评价
  • 4.1.语音合成系统的构建
  • 4.2.合成语音质量的评价
  • 第五章 结论
  • 附录1 韵律标注文件格式示例
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].基于音高映射合成语音的汉语双字调声调训练[J]. 清华大学学报(自然科学版) 2017(02)
    • [2].机械合成语音,能最终实现吗?[J]. 世界科学 2012(02)
    • [3].基于TMS320C6678的合成语音检测系统的设计与实现[J]. 电子设计工程 2016(19)
    • [4].一种基于LSTM的合成语音自然度评价方法的研究[J]. 信息技术 2019(05)
    • [5].动脑不动口 脑机来帮忙[J]. 北方人(悦读) 2019(11)
    • [6].后置滤波器参数自适应的语音合成改进算法[J]. 计算机工程与应用 2017(01)
    • [7].声音复刻站:Lyrebird[J]. 少年电脑世界 2018(10)
    • [8].基于统计建模的可训练单元挑选语音合成方法[J]. 科学通报 2009(08)
    • [9].AI合成语音背景下播音主持应以情感制胜[J]. 传媒论坛 2018(23)
    • [10].低码率语音编码中过渡帧对合成语音的影响[J]. 应用声学 2016(01)
    • [11].融合自动检错的单元挑选语音合成方法[J]. 数据采集与处理 2016(02)
    • [12].基于合成质量预测的单元挑选语音合成优化方法[J]. 清华大学学报(自然科学版) 2013(06)
    • [13].TETRA与G.729语音编码算法的比较研究[J]. 电视技术 2013(15)
    • [14].可训练语音合成在越南语合成中的应用[J]. 计算机工程与应用 2012(35)
    • [15].汉语连续变调语音合成算法[J]. 计算机工程与应用 2009(15)
    • [16].改进的混合激励线性预测编码算法[J]. 新型工业化 2015(09)
    • [17].可训练语音合成在侗语合成中的应用[J]. 教育文化论坛 2012(06)
    • [18].改进的MELP低速率语音编码器[J]. 计算机工程与应用 2011(29)
    • [19].“声音”作为未来传播主流介质的洞察范式——以用户对语音新闻感知效果与测量为例[J]. 社会科学战线 2019(07)
    • [20].基于规则的汉语情感语音系统的设计与实现[J]. 电子测量技术 2009(11)
    • [21].MELP低速率语音编码器在DSP上的改进与优化[J]. 计算机应用研究 2011(06)
    • [22].自适应谱增强在MBE语音编码中的应用研究[J]. 重庆工商大学学报(自然科学版) 2013(03)
    • [23].基于短信和语音合成的报警接口设计[J]. 微计算机信息 2010(11)
    • [24].一种改进的MELP算法[J]. 应用科技 2008(05)
    • [25].多带激励MBE谱幅度估计与参数编解码方案研究[J]. 电子设计工程 2011(16)
    • [26].面向汉语统计参数语音合成的标注生成方法[J]. 计算机工程与应用 2016(19)
    • [27].汉语重音的凸显度分析与合成[J]. 声学学报 2015(01)
    • [28].藏语拉萨话语音合成语料库的研究与建立[J]. 科技信息 2013(09)
    • [29].声纹识别中合成语音的鲁棒性[J]. 模式识别与人工智能 2011(06)
    • [30].基于HMM的混合激励英语文语转换系统[J]. 江南大学学报(自然科学版) 2010(06)

    标签:;  ;  ;  ;  

    汉语TTS中的韵律建模与合成方法研究
    下载Doc文档

    猜你喜欢