论文摘要
本文在回顾文语转换系统(Text to Speech, TTS)的发展历程、应用现状以及典型技术的基础上,就面向航天测试的语音合成系统的设计、实现的全过程进行论述,并就其实现细节做了全面的介绍。目前通常意义下的TTS系统多指一种可以将输入的文本转换为语音输出的计算机应用系统。TTS可以自动的对文本进行分析,确定文本中各部分的读音、停顿、语气语调等,再根据预先存储的语音片断或可以转换为语音片断的信息将输入的文本所对应的语音合成出来作为输出加以播放。常见的商业TTS系统结构复杂,规模庞大,足以应对日常的文语转换需求,但对于某一专业领域内的文本却难以产生很好的转换效果,这主要是由于文本中含有大量专业词汇无法被TTS中自带的词典所识别,所以不能正确确定字词之间的结合关系及停顿标记导致声音质量下降。此外专业领域内可能含有一定量的外文词汇、字母、缩写,数学表达式,单位符号,专业内的特别读音约定等。以上这些都成为建立面向某一专业应用领域的TTS系统的主要动机。航天器可以认为是一种极为复杂的人造系统,并且工作于严苛的自然条件下,造价也非常昂贵。对航天器在建造过程中以及发射前所进行的测试就显得极为重要。为达到足够高的可靠性,航天测试相当严格,过程也非常繁琐。为降低测试人员的劳动强度,提高测试效率,保证测试的准确性,我们在航天器的测试系统中引入了TTS系统,通过语音的交流取代了原有对屏幕的观察,提高了测试效率,减小测试人员的工作压力。另外通过选择悦耳的语音也有降低测试人员心理压力,放松心情的功效,起到减少失误和错误的作用。根据航天测试的需求,我们建立了应用于航天测试的专业TTS系统。本文给出了该系统设计和实现的全部细节,其中的创新和特点可以总结如下:1.将TTS应用于航天测试领域,将之与测试诸系统进行集成,初步形成方便人机交互的VoiceUI。2.在基本合成声学单元的选择方面,采取了不定长单元的设置,用于汉语普通话合成的声学单元有多音节词组、词、字、单音节等形式的声学单元,用于西文单词、字母及缩写的合成则是采取单词、音节、声母/韵母音素的发声单元等形式。通过采取这样的声学单元设置可以在合成质量和语音库的大小之间形成一定的折衷。3.在韵律模型方面采用了参数化的Target模型。这主要是由于本系统的韵律结构相对简单,以祈使、陈述为主,而且其中所涉及到的中外文混读皆是连续的中文语流中混有西文单词或字母组合,外文内容对中文的影响相对较小。4.在Corpus文本的收集方面,除收集常规的文本内容外,更加注重航天测试专业文本的收集以及相关词典的编制。5.在设计录音脚本时,采取了评分动态调整的策略,改良贪心算法。利用这种设计录音脚本的算法所形成的脚本中的词频分布可以被设置为与原始文本中的词频分布相似或任意指定的分布形式。通过这样的算法,调整录音脚本中词频分布在一定程度上可以弥补原始文本中的不足。6.发声单元自动筛选。通过采取一系列聚类分析及神经网络等手段将一些不理想的发声单元去除。本文的内容依据该TTS系统在的设计及实际开发过程所遇到的问题及解决方案所撰写。本文所论述的TTS系统已经运用在我所多个卫星测试系统中,并取得了良好的效果。
论文目录
相关论文文献
标签:语音合成论文; 语转换论文; 多语言混合语音合成论文; 航天测试论文;