语音信号处理技术研究

论文摘要

语音信号处理技术是语音处理领域中新近发展起来的一个学科分支,本文主要研究了语音信号处理技术中的两个主要内容:语音时长规整技术和说话人特征改变技术。语音时长规整技术就是在不改变语音音调并保证良好音质的前提下,随意地改变语音播放速度,就仿佛说话人自己在改变说话速度一样。说话人特征改变技术是语音处理中一个比较新的交叉边缘分支,主要是通过对合成语音进行适当语音参数控制和调整来实现的。针对语音时长规整技术,研究了固定同步重叠叠加（SOLAFS）算法中合成相邻帧间距ss和搜索总长度kmax的最佳参数选取,实验表明ss的取值在不小于一个平均基音周期的同时不大于帧长与一个平均基音周期的差值;kmax的取值约为一个平均基音周期。在此基础上得出了人耳对基音同步的感知存在一定的容差从而改进了二次谱提取基频算法,提高了基频提取的准确度,进一步提出了一种新的基于改进二次谱的语音时长规整算法,与SOLAFS算法相比,该算法在保持规整后语音质量的同时,有效降低了整体计算复杂度。针对说话人特征改变技术,提出了一种基于重采样的基频改变算法,该算法简单有效,整体计算复杂度较低;提出了一种非等比例调整前三个共振峰的方法,独立调整前三个共振峰的同时保证了信号总能量不变;提出了一种男女声频谱倾斜差异补偿方法,提高了男声变女声时输出语音的自然度。融合所研究的各种特征参数改变方法,构建了基于倒谱的说话人特征改变系统。最后采用混合编程方式,实现了集语音时长规整技术和说话人特征改变技术于一体的语音信号处理软件。本软件采用VC++和Matlab混合编程的思想,利用该软件,可以实现对输入语音进行变速和变声处理两个功能。在变声处理中,可以实现男声、女声、童声和老人声等之间的快速转换,也可以手动设置特征参数,进行其他要求的语音特征改变,如同性别之间的语音特征改变等。除此之外,还可以实现现场变速变声等其他功能。

论文目录

摘要

ABSTRACT

第一章引言

1.1 研究背景及选题意义

1.2 国内外研究动态

1.2.1 语音时长规整技术研究动态

1.2.2 说话人特征改变技术研究动态

1.3 论文研究的主要内容

1.4 论文结构安排

第二章语音时长规整技术研究与实现

2.1 语音信号处理基础理论

2.1.1 语音信号的基本特性

2.1.2 语音信号的预处理

2.1.3 语音音质评价方法

2.2 时域法原理及仿真实现

2.2.1 重叠叠加算法

2.2.2 固定同步重叠叠加算法

2.3 SOLAFS算法参数选取研究

s的选取'>2.3.1 合成后相邻帧间距s_s的选取

max的选取'>2.3.2 搜索总长度k_max的选取

2.4 人耳对基音同步的感知问题

2.5 改进的二次谱基频提取算法

2.6 基于改进二次谱提取基频的时长规整算法

2.7 本章小结

第三章说话人特征改变技术研究与实现

3.1 语音信号处理基础理论

3.1.1 语音信号的发生机理和产生模型

3.1.2 语音信号的基本分析方法

3.1.3 语音音质评价方法

3.2 一种基于重采样的基频改变算法

3.2.1 算法原理

3.2.2 仿真实验

3.3 基于谱包络估计的共振峰提取

3.3.1 LPC提取谱包络原理

3.3.2 倒谱提取谱包络原理

3.3.3 仿真实验

3.4 基于谱包络压扩的共振峰改变

3.4.1 等比例压扩谱包络

3.4.2 分段等比例压扩谱包络

3.5 一种男女声频谱倾斜差异补偿方法

3.5.1 算法原理

3.5.2 仿真实验

3.6 基于倒谱的说话人特征改变系统

3.6.1 LPC模型分析

3.6.2 系统框图

3.6.3 实现步骤

3.6.4 仿真实验

3.7 本章小结

第四章语音信号改变软件的实现

4.1 总体设计方案

4.2 实现方法

4.3 本章小结

第五章总结和展望

5.1 全文工作总结

5.2 未来研究展望

致谢

参考文献

学位论文评阅及答辩情况表

语音信号处理技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢