论文摘要
语音处理技术有着广泛的应用领域,歌声合成是语音处理技术的一个新的应用领域。对歌声合成方法的研究在谱曲作词、唱片制作、娱乐等领域都有很大的应用价值,虽然国际上对歌声合成方法已有一定的研究,但针对普通话的歌声合成方法则开展得较少,同时由于比单纯的语音合成多了关于音调检测与变换方面的处理过程,因此具有一定的挑战性。针对一个实际的普通话歌声合成应用需求,本文力图在现有语音合成与歌声合成技术基础上,建立起一个具有较高合成质量的普通话歌声合成系统。首先,本文介绍了音频处理、语音及歌声合成方面的主要技术,以及基于语料库的歌声合成方法的体系结构。其次,本文详细给出了歌声合成语料库的预处理方法,在此基础上研究并实现了对歌声的音符自动切分、清浊音识别、音高识别等歌声预处理算法。第三,提出了一种基于自适应滤波器的歌声旋律调整算法。算法的核心部分是设计一个具有自适应能力的滤波器,将音频信号的每一个周期都准确的检测出来。接着利用Hanning窗来平滑,减少了调整后音频信号的噪音。本文设计并实现了该旋律自动调整系统,并将处理结果与已有的旋律调整算法进行了比较。实验结果表明,本文提出的旋律调整算法获得的音质要优于其它方法。最后,在上述算法基础上,针对本文对歌声合成的具体应用需求,设计了一个基于语料库的歌声合成算法,为了增加合成歌声的清晰度与流畅度,设计了压线与歌声音强平滑等后处理算法,并实现了一个基于给定旋律与歌词的歌声合成系统,该系统首先检测出给定旋律所对应的音高、音长,然后对歌词对应的歌声语料库进行旋律变换与歌声合成,最终输出合成后的歌声。为了对合成质量进行评估,本文将歌声合成的结果进行了主观评测,结果表明,歌声合成的结果是可以接受的,该系统可以用于日常的娱乐。