基于二元语义标注的波形拼接语音合成

基于二元语义标注的波形拼接语音合成

论文摘要

语音合成(TTS,Text To Speech)技术是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。随着计算机技术和通讯技术的巨大发展,TTS技术已经应用到语音对话系统、语音呼叫中心、语音触发的网站和电子邮件服务等很多领域并且已经发挥出其巨大的威力,但是,当前现有的TTS系统在自然度和可懂度方面都离人们的要求相差甚远,真正能够代替人来阅读的TTS系统还没有出现,从而也制约着TTS系统在更大的范围内的使用。 在语音合成方面,首先遇到的困难是从文本信息到韵律的标识上,自然语言中,语音特征变化万千,其数据本身隐含了知识。而对这些知识,人类可以感知,但对其的认识、描述是远远不够的。在从文字到韵律符号描述的自动转换方面,对自然语音理解能力的不足一直是研究工作的瓶颈所在。目前文字到韵律描述的转换通常只能根据一些基本的语法信息(如词性)来划分语调短语或设置语句的普通重音,还没有根据句子的语义来做深层次处理(如设置不同的表达或感情色彩)的能力。其次,从声学的层面上,人们对韵律特征对应的声学参数还没有完全认识,缺乏完备的描述,只能凭经验。这也进一步阻碍了将文本标注的韵律信息表现出来,生成自然的带有韵律感和重音感的合成语音。 本文借助我们实验室以往对自然语言理解处理的成果——二元语义关系分析。建立了一套符合XML扩展标记语言标准的文本语音合成描述符号体系,同时建立了从语义描述标注到语音合成韵律标注的转换规则,将对语义的描述自动转换到语音韵律信息的描述。而且,还考虑到了文本中的多音字、数字、符号、字母的发音问题,建立了一系列针对这些情况的发音描述方式。 在韵律语音的合成上,本文搜集了1248个汉语中的单字和8000多个使用频率较高的双字词、三字词、四字词以及常用人名、地名等语料信息,对其进行整理编号后,在转门为本系统开发的语音库维护程序上对这些语料进行了人工录音,对这些语音资料切分和基音周期分析后,存入语音数据库和检索索引数据库,构建了本系统所需要的基础语音数据。 语音合成模块包含语速修改单元、语气修改单元、重音修改单元以及静音生成单元等,并且把它们做成模块的形式,提供接口供语音合成模块调用以改变语

论文目录

  • 摘要
  • ABSTRACT
  • 1 引言
  • 1.1 课题的研究背景及意义
  • 1.2 语音合成的发展现状
  • 1.2.1 国内外语音合成的发展状况
  • 1.2.2 语音合成中的语音标注和韵律
  • 1.2.3 基本语音合成理论
  • 1.2.4 一个完整的语音合成系统的构成
  • 1.3 语音合成中遇到的难题
  • 1.4 课题的研究方案的确定
  • 2 二元语义标注到语音合成标注的映射模型
  • 2.1 二元语义关系分析
  • 2.1.1 什么是二元语义分析
  • 2.1.2 二元语义关系分析结果的标注形式
  • 2.2 语音合成标注
  • 2.2.1 语音合成标注中标记符号的位置
  • 2.2.2 本系统所用的标注符号
  • 2.3 文本标注中的多音字和非汉字读音的确定
  • 2.3.1 多音字读音的确定方法
  • 2.3.2 文本中的数字读音的确定方法
  • 2.3.3 文本中的字母和符号读音的确定方法
  • 2.4 由二元语义分析标注到语音合成标准的映射
  • 2.4.1 映射规则
  • 2.4.2 实现步骤
  • 2.4.3 存在的问题
  • 3 标注文本到韵律语音的合成
  • 3.1 语音合成的基本理论讨论
  • 3.1.1 共振峰合成
  • 3.1.2 LPC参数合成
  • 3.1.3 PSOLA合成技术
  • 3.2 波形拼接语音合成和PSOLA算法
  • 3.3 韵律建模
  • 3.4 标注文本的解析
  • 3.5 语音库的建设
  • 3.5.1 语音库语料的选择
  • 3.5.2 基音标注
  • 3.5.3 语音库语音单元的生成和标注
  • 3.5.4 语音库结构设计
  • 3.6 由标注文本控制合成韵律语音
  • 3.7 语音合成中提高合成速度的方式
  • 3.7.1 在检索方式上
  • 3.7.2 在合成方式上
  • 4 汉语语音合成系统的进一步讨论
  • 5 语音合成及语音库维护实验平台介绍
  • 5.1 语音库维护平台
  • 5.2 语音标注与合成平台
  • 6 合成测试
  • 7 总结
  • 参考文献
  • 致谢
  • 攻读学位期间所发表的学术论文
  • 相关论文文献

    • [1].基于语音合成的智慧导游系统的研究与设计[J]. 信息技术 2020(02)
    • [2].语音合成技术发展综述与研究现状[J]. 科技风 2017(22)
    • [3].基于语音合成的语音提醒器研究[J]. 通讯世界 2018(09)
    • [4].改进参数控制的可视语音合成方法[J]. 计算机工程与设计 2017(04)
    • [5].语音合成技术在声音修复上的尝试[J]. 现代电影技术 2019(07)
    • [6].基于图片的语音合成研究[J]. 电子制作 2018(14)
    • [7].具有情感表现力的可视语音合成研究综述[J]. 计算机工程与科学 2015(04)
    • [8].情感语音合成综述[J]. 现代计算机(专业版) 2014(20)
    • [9].基于统计机器学习的端到端的语音合成研究[J]. 电子世界 2020(06)
    • [10].基于可视语音合成的3D通信技术研究[J]. 计算机应用研究 2009(11)
    • [11].基于语料库的藏语语音合成单元选择算法[J]. 中文信息学报 2017(05)
    • [12].基于语音合成的非接触式红外温度计[J]. 电子质量 2019(04)
    • [13].基于汉语视频三音素的可视语音合成[J]. 电子与信息学报 2009(12)
    • [14].可训练语音合成在维吾尔文合成中的应用[J]. 信息通信 2008(05)
    • [15].汉语情感语音合成的研究[J]. 科技信息(科学教研) 2008(09)
    • [16].基于多情感说话人自适应的情感语音合成研究[J]. 湘潭大学自然科学学报 2018(04)
    • [17].来了短信自动念[J]. 电脑爱好者(普及版) 2012(10)
    • [18].情感语音合成中韵律参数的基频研究[J]. 小型微型计算机系统 2013(09)
    • [19].基于神经网络的藏语语音合成[J]. 中文信息学报 2019(02)
    • [20].基于WaveNet的端到端语音合成方法[J]. 计算机应用 2019(05)
    • [21].基于规则及N-gram模型的数字数据转换成哈萨克语读音文字的方法[J]. 电脑知识与技术 2017(14)
    • [22].人工智能语音识别英语口语评估路径探讨[J]. 信息记录材料 2019(11)
    • [23].皮肤听声原理在语音合成中的应用研究[J]. 现代电子技术 2020(19)
    • [24].计算机语音合成技术研究及发展方向[J]. 科技与企业 2014(01)
    • [25].基于GSM网络具有语音合成功能系统的设计与实现[J]. 网络安全技术与应用 2015(02)
    • [26].藏语语音合成中语料数据标注规则的设计[J]. 西藏大学学报(自然科学版) 2012(01)
    • [27].一种基于Tacotron 2的端到端中文语音合成方案[J]. 华东师范大学学报(自然科学版) 2019(04)
    • [28].车载语音合成真的很重要,ROHM旗下蓝碧石半导体给出“硬”方案[J]. 中国电子商情(基础电子) 2020(07)
    • [29].简化LSTM的语音合成[J]. 计算机工程与应用 2018(03)
    • [30].计算机语音合成系统的研究与应用[J]. 电声技术 2009(06)

    标签:;  ;  ;  

    基于二元语义标注的波形拼接语音合成
    下载Doc文档

    猜你喜欢