基于语料库的歌声合成方法

论文摘要

语音处理技术有着广泛的应用领域,歌声合成是语音处理技术的一个新的应用领域。对歌声合成方法的研究在谱曲作词、唱片制作、娱乐等领域都有很大的应用价值,虽然国际上对歌声合成方法已有一定的研究,但针对普通话的歌声合成方法则开展得较少,同时由于比单纯的语音合成多了关于音调检测与变换方面的处理过程,因此具有一定的挑战性。针对一个实际的普通话歌声合成应用需求,本文力图在现有语音合成与歌声合成技术基础上,建立起一个具有较高合成质量的普通话歌声合成系统。首先,本文介绍了音频处理、语音及歌声合成方面的主要技术,以及基于语料库的歌声合成方法的体系结构。其次,本文详细给出了歌声合成语料库的预处理方法,在此基础上研究并实现了对歌声的音符自动切分、清浊音识别、音高识别等歌声预处理算法。第三,提出了一种基于自适应滤波器的歌声旋律调整算法。算法的核心部分是设计一个具有自适应能力的滤波器,将音频信号的每一个周期都准确的检测出来。接着利用Hanning窗来平滑,减少了调整后音频信号的噪音。本文设计并实现了该旋律自动调整系统,并将处理结果与已有的旋律调整算法进行了比较。实验结果表明,本文提出的旋律调整算法获得的音质要优于其它方法。最后,在上述算法基础上,针对本文对歌声合成的具体应用需求,设计了一个基于语料库的歌声合成算法,为了增加合成歌声的清晰度与流畅度,设计了压线与歌声音强平滑等后处理算法,并实现了一个基于给定旋律与歌词的歌声合成系统,该系统首先检测出给定旋律所对应的音高、音长,然后对歌词对应的歌声语料库进行旋律变换与歌声合成,最终输出合成后的歌声。为了对合成质量进行评估,本文将歌声合成的结果进行了主观评测,结果表明,歌声合成的结果是可以接受的,该系统可以用于日常的娱乐。

论文目录

摘要

Abstract

第1章绪论

1.1 课题背景

1.2 本课题研究的目的及意义

1.3 语音与歌声的对比

1.3.1 语音的特性

1.3.2 歌声的特性

1.4 国内外相关技术发展现状

1.4.1 语音合成技术发展现状

1.4.2 歌声合成技术发展现状

1.5 本文主要研究内容

第2章歌声合成系统体系结构

2.1 系统体系结构

2.2 歌声语料库的构建方法

2.3 合成单元选择

2.3.1 字音转换

2.3.2 目标距离函数

2.4 旋律和幅值调整

2.5 音乐效果

2.5.1 混响

2.5.2 背景音乐

2.6 本章小结

第3章歌声预处理算法

3.1 简介

3.2 端点检测

3.2.1 简介

3.2.2 歌声端点检测方法

3.3 清浊音切分

3.3.1 简介

3.3.2 清浊音切分算法

3.4 音符识别

3.4.1 简介

3.4.2 音符识别算法

3.5 本章小结

第4章基于自适应滤波器的旋律和幅值调整算法

4.1 引言

4.2 信号周期检测

4.3 旋律和幅值调整

4.4 信号拼接合成

4.5 旋律调整算法的评估

4.5.1 体系结构

4.5.2 试验结果比较

4.6 本章小结

第5章歌声合成算法的实现与评测

5.1 引言

5.2 系统设计与实现

5.2.1 语料库的设计

5.2.2 系统流程图

5.2.3 系统模块的设计

5.2.4 系统实现

5.3 系统评测

5.3.1 评测方法

5.3.2 评测结果

5.4 本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

基于语料库的歌声合成方法

论文摘要

论文目录

相关论文文献

猜你喜欢