论文摘要
近十几年来,随着针对语音信号的统计建模方法的日益成熟以及参数合成器性能的不断提升,统计参数语音合成(Statistical Parametric Speech Synthesis)思想被提出,并得到了越来越多研究者的关注。其中,以基于隐马尔可夫模型(Hidden Markov Model,HMM)的参数语音合成方法为代表,该方法已逐步发展成为和基于语料库的单元挑选与波形拼接合成方法相并列的一种主流语音合成方法。相比传统的单元挑选与波形拼接合成方法,基于HMM的参数语音合成方法具有合成语音流畅度高、鲁棒性好,系统构建速度快、自动化程度高,系统尺寸小、灵活度高等优点。本文以统计声学模型在语音合成中的应用为研究重点,在原有基于HMM的参数合成方法之外,提出了两种新的基于统计声学建模的语音合成方法。第一,基于HMM的单元挑选与波形拼接合成:我们将HMM参数语音合成中使用的声学参数建模思想,与传统的单元挑选与波形拼接合成方法相结合,使用概率准则指导最优单元搜索,通过拼接波形生成最终语音,以克服参数合成方法在生成语音音质上的不足,提高合成语音的自然度;第二,融合声学参数与发音器官参数(Articulatory Feature)的建模与合成:我们在声学参数之外,引入和语音产生机理更加紧密相关的发音器官参数,通过对原有的HMM模型结构进行改进,实现两种参数的联合建模与生成,从而提高合成时声学参数预测的精确度和灵活性。整篇文章的安排如下:第1章是绪论,将回顾语音合成的发展历史,并对常见的几种语音合成方法进行简要的介绍。第2章将具体介绍基于HMM的参数语音合成方法,包括HMM的基本原理、系统框架、关键技术点等,并通过对此方法特点的分析,阐明我们进行新的语音合成方法研究的动机与出发点。第3章将重点介绍基于HMM的单元挑选与波形拼接语音合成算法。首先我们提出了使用HMM进行单元挑选的两种不同的实现形式,一种以帧为拼接单元,基于最大似然准则实现单元搜索,另一种使用音素和帧的两级拼接单元,结合似然值准则和Kullback-Leibler距离(Kullback-Leibler Divergence,KLD)进行单元选择;然后,我们归纳出了基于HMM的单元挑选合成的统一算法框架,并通过在中文和英文合成系统上的测试证明了此算法的有效性;最后,我们提出了最小单元挑选错误(Minimum Unit Selection Error,MUSE)准则,用以替代原有HMM训练中使用的最大似然准则,实现了合成系统的全自动构建,并进一步提高了合成语音的自然度。第4章将介绍融合发音器官参数与声学参数的统计建模与合成。这里的“发音器官参数”指的是对发音过程中说话者舌、唇、下颚等发音器官的位置以及运动情况的定量描述。在阐明了引入发音器官参数的原因以及对原有系统框架进行了简单回顾后,我们提出了对声学参数和发音器官参数进行联合建模与参数生成的总体思路,并且从模型聚类策略、状态的同步性假设以及特征之间的独立性假设三个方面,讨论了几种可能的模型结构;然后,通过一系列的客观和主观评测,证明了这种结合发音器官参数的系统构建方法在提高声学参数预测的精确度和灵活性方面的有效性。第5章对全文进行了总结。
论文目录
相关论文文献
- [1].发音器官与语言发生[J]. 现代语文(学术综合版) 2012(04)
- [2].苍天为证:真的只是口误[J]. 故事家 2017(15)
- [3].“歌唱勇士”——蝉[J]. 北极光 2017(08)
- [4].浅谈声乐语言的发音[J]. 才智 2008(20)
- [5].在音乐教学中怎样培养学生的“音乐嗓子”[J]. 中国农村教育 2019(15)
- [6].蜜蜂的发音器官之谜[J]. 小学科学 2010(03)
- [7].倾听细胞的喧闹[J]. 大科技(科学之谜) 2013(03)
- [8].基于深度神经网络的语音驱动发音器官的运动合成[J]. 自动化学报 2016(06)
- [9].汉语“发音器官”的概念转喻研究[J]. 高考(综合版) 2013(07)
- [10].如何快速提高阅读速度[J]. 中学英语之友(高一版) 2009(10)
- [11].论脑文本与语言生成[J]. 华中师范大学学报(人文社会科学版) 2019(06)
- [12].超声波成像技术在生理语音学中的应用[J]. 南开语言学刊 2013(01)
- [13].“发音器官”的概念隐喻在汉语词汇教学中的应用[J]. 佳木斯教育学院学报 2014(04)
- [14].2种墨天牛摩擦发音器超微结构的比较研究[J]. 安徽农业科学 2014(18)
- [15].卷首[J]. 中国音乐教育 2010(02)
- [16].蟋蟀的“通讯工具”[J]. 第二课堂(小学) 2010(Z2)
- [17].孩子口吃怎么办[J]. 新农村 2019(12)
- [18].蟋蟀巧用“BP”机[J]. 科学之友(上旬) 2010(05)
- [19].走近不爱说话的孩子[J]. 小学生作文辅导(教师适用) 2011(07)
- [20].蝈蝈——关在笼子里的大自然[J]. 中华活页文选(八年级) 2011(03)
- [21].浅谈默读教学[J]. 学苑教育 2012(12)
- [22].三招消除心因性口吃[J]. 家庭科技 2011(10)
- [23].民谣在文艺作品中的运用[J]. 躬耕 2014(06)
- [24].儿童口吃与心理有关[J]. 开卷有益(求医问药) 2012(06)
- [25].如何提高阅读速度[J]. 少年读者 2008(05)
- [26].3种天牛科昆虫摩擦发音器的超微结构及摩擦发音机制分析[J]. 南京林业大学学报(自然科学版) 2013(01)
- [27].基于语音信号的发音器官运动估计方法综述[J]. 中国传媒大学学报(自然科学版) 2018(01)
- [28].小议默读[J]. 成功(教育) 2010(10)
- [29].蟋蟀用“BP机”寻爱[J]. 科学24小时 2008(03)
- [30].帮特殊儿童走出困境[J]. 课程教育研究 2015(30)