论文摘要
语音合成技术在当今是个前沿和热门的课题,本文针对语音合成系统中的语料预选开展研究,针对语料预选的特点,将CART决策树理论应用于预选过程,提出了基于二进制位的数据表示方法来表示预选规则,并用其设计实现了语料预选树,最终应用生成的预选树设计实现了一个语音合成系统,合成出了较为自然流利的语音。基于语料库的语音合成方法是未来一段时间合成自然语音的最重要方式。语料预选是基于语料库语音合成的一个重要课题,本文将CART决策树算法应用于语料预选,并通过实验检验其效果。本文提出了基于二进制位的数据表示方法,并将其应用于预选树规则的表示。本文提出的基于二进制位的数据表示方法可以便捷的表示集合和其子集,采用决策树算法的预选树实际就是用其规则不断分割数据,直到找到对应的分类,通过运用基于二进制位的数据表示方法,在进行判定时可以采用一系列的逻辑位运算来实现,远比一般的匹配类别算法快捷。针对采用简单问题对多维数据分类可能造成的被分类数据过度片断化问题,本文研究了采用复合问题集将简单问题分类结果进行优化的方法。论文对语料库的数据进行了分析统计处理,具体设计了程序TTS TRAIN实现语料预选树的创建,并根据最小复合代价原则对预选树进行了评估剪枝。在基于CART语料预选树的语音合成系统实现中,本文给出了语音合成系统的结构和模块构成。本文设计了汉字区位码、拼音和预选树的索引对照文件以解决由汉字到拼音和预选树快速查询。论文应用海量分词软件划分语法词层,采用了人工标注方法训练C4.5决策树,并用C4.5算法实现了韵律层级标注。用语料预选树进行了语料的预选,并应用Viterbi算法对语料进行了最终的选择。通过设计实验得出本文实现的语音合成系统的语音合成质量为可以接受到较好。