基于语法信息的汉语韵律结构预测

基于语法信息的汉语韵律结构预测

论文摘要

高自然度的语音合成是人机交互领域的一个重要研究课题。为提高合成语音的自然度,需要知道准确的合成文本的韵律结构。为此,论文分析了汉语文本的语法结构与韵律结构之间的关系,重点研究了韵律词和韵律短语的预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有重要的理论意义和应用价值。论文的主要研究成果和创新点如下:1.建立了一个大规模的文本语料库。该语料库包含20000句文本语料,标注了语法信息和韵律信息。韵律信息在语言学专家的指导下手工标注。完成的语料库经过了语言学专家的抽查,并与语言学专家标注结果进行了对比。结果表明,手工标注的韵律词和韵律短语的综合参数得分分别达到了98%和85%,可用于韵律结构预测的研究中。2.提出了一种以相邻语法词词长和词性为特征,利用TBL算法进行韵律词预测的方法。通过对手工标注过的语料库进行统计分析,发现相邻语法词长和相邻语法词词性是从语法词映射到韵律词的主要特征。基于这一特征,利用TBL转换学习算法进行了韵律词的预测。结果表明,该方法在测试集上分别得到了97.5%的精确率、召回率以及综合参数,优于现有的研究结果。3.提出了一种新的用于韵律结构预测的语法结构描述特征——邻接度(Adjacent Degree, AD),利用邻接度描述了语法结构和韵律结构之间的关系。基于邻接度这一新特征,利用TBL算法进行了韵律短语的预测。测试集上的结果表明,该方法在韵律短语的预测上,精确率达到了75.2%,召回率达到了77.1%,综合参数达到了76.1%。4.提出了一种基于邻接度的韵律结构描述方法,该方法结合了基于邻接度的语法结构描述方法和原有的三层韵律结构的描述方法,并从韵律停顿边界长度与邻接度的关系、韵律停顿边界位置与语速的相关性、韵律停顿与重音的关系三个方面对原有的韵律结构描述方法进行了扩充。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景及意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 韵律结构预测的研究现状
  • 1.2.1 韵律预测的研究现状
  • 1.2.2 汉语韵律结构预测的研究现状
  • 1.3 本文工作介绍
  • 1.4 论文内容安排
  • 第2章 研究基础
  • 2.1 文-语转换语音合成系统
  • 2.1.1 文本分析
  • 2.1.2 韵律生成
  • 2.1.3 语音生成
  • 2.2 汉语韵律结构的研究
  • 2.2.1 汉语的韵律研究
  • 2.2.2 韵律结构与语法结构
  • 2.3 句法分析
  • 2.3.1 汉语自动分词及词性标注
  • 2.3.2 基于规则的句法分析
  • 2.3.3 基于统计方法的句法分析
  • 2.4 讨论与小结
  • 第3章 韵律语料库的建立
  • 3.1 语料的准备
  • 3.2 标准标注语料
  • 3.2.1 标注流程
  • 3.2.2 标注工具
  • 3.2.3 经验总结
  • 3.3 标注评价函数及评测结果
  • 3.4 讨论与小结
  • 第4章 基于词长和词性的汉语韵律词预测
  • 4.1 语法词与韵律词的相互关系
  • 4.1.1 语法词与韵律词关系的定性分析
  • 4.1.2 统计分析结果
  • 4.2 韵律词预测
  • 4.2.1 算法介绍
  • 4.2.2 实验
  • 4.3 讨论与小结
  • 第5章 基于语法结构的韵律短语预测
  • 5.1 韵律层级结构和语法结构的分析
  • 5.2 邻接度
  • 5.3 基于邻接度的语法结构和韵律结构关系的统计分析
  • 5.4 韵律短语预测
  • 5.4.1 实验介绍
  • 5.4.2 实验特征选择
  • 5.4.3 实验结果分析
  • 5.5 讨论与小结
  • 第6章 基于邻接度的韵律结构描述方法
  • 6.1 基于邻接度的韵律结构描述方法
  • 6.2 韵律边界停顿的描述扩充
  • 6.2.1 基于邻接度的边界停顿长度统计
  • 6.2.2 边界停顿位置与语速的相关性
  • 6.3 边界停顿与重音的关系
  • 6.4 讨论与小结
  • 第7章 总结及展望
  • 7.1 工作总结
  • 7.2 工作展望
  • 附录
  • 参考文献
  • 攻读硕士期间发表的学术论文与主要成果
  • 致谢
  • 相关论文文献

    • [1].复合词的内外部语法信息与词的多义性[J]. 长江大学学报(社科版) 2014(11)
    • [2].英语语法信息树[J]. 赤峰学院学报(自然科学版) 2013(15)
    • [3].用户视角下英语习语词典语法信息探析[J]. 辞书研究 2018(01)
    • [4].浅析《新时代英汉大词典》中句法层面上的语法信息及其标注[J]. 哈尔滨职业技术学院学报 2009(01)
    • [5].《蒙古语语法信息词典》管理平台的设计与实现[J]. 内蒙古师范大学学报(自然科学汉文版) 2009(04)
    • [6].藏语动词语法信息库构建研究[J]. 西北民族大学学报(自然科学版) 2011(03)
    • [7].从词典查阅的认知心理看英汉词典内的动词语法信息描述[J]. 湖北广播电视大学学报 2008(01)
    • [8].融合语义与语法信息的中文评价对象提取[J]. 智能系统学报 2019(01)
    • [9].从古文字构形看汉语的语法信息[J]. 励耘语言学刊 2017(02)
    • [10].“理解”论:信息内容认知机理的假说[J]. 北京邮电大学学报 2008(03)
    • [11].英语学习词典中谓词的语法搭配信息[J]. 外语教学与研究 2010(05)
    • [12].《蒙古语语法信息词典量词分库》的建设[J]. 内蒙古师范大学学报(哲学社会科学版) 2009(03)
    • [13].语法信息与韵律结构的分析与预测[J]. 中文信息学报 2010(01)
    • [14].以学生的能力为指导——定语从句新思路[J]. 科技信息(学术研究) 2008(24)
    • [15].任务性质、家族大小和词类一致性对义符语法信息激活的影响[J]. 心理学报 2019(10)
    • [16].浅议语法与英语学习词典[J]. 西安社会科学 2010(03)
    • [17].蒙古语复合名词的语义分类[J]. 语文学刊 2013(11)
    • [18].形态句法研究的c-统制视角[J]. 方言 2008(04)
    • [19].基于语料库的藏语副词搭配研究[J]. 西北民族大学学报(自然科学版) 2011(04)
    • [20].2007—2008年汉语语文词典理论前沿(释义理论部分)[J]. 鲁东大学学报(哲学社会科学版) 2009(04)
    • [21].未来[J]. 艺术界 2015(04)
    • [22].基于语言模型和特征分类的抄袭判定[J]. 计算机工程 2013(05)
    • [23].基于词对特征的事件新侧面探测[J]. 计算机工程 2009(03)
    • [24].作战命令的语法信息计算模型[J]. 信息与电子工程 2008(01)
    • [25].课堂教学中的信息传递、控制与教学策略探讨[J]. 上海教育科研 2012(07)
    • [26].词汇教学法提高英语综合水平的实证研究[J]. 科技信息 2010(04)
    • [27].朝鲜语敬语词加工中的空间隐喻和重量隐喻——语义信息与语法信息的双重作用[J]. 外语教学与研究 2020(06)
    • [28].基于极性转移和LSTM递归网络的情感分析[J]. 中文信息学报 2015(05)
    • [29].词典编纂理念的二度转向[J]. 辞书研究 2010(06)
    • [30].初中英语“六步阅读教学法”教学模式的探究[J]. 中小学教学研究 2012(02)

    标签:;  ;  ;  ;  ;  ;  

    基于语法信息的汉语韵律结构预测
    下载Doc文档

    猜你喜欢