论文摘要
语音信号处理技术是语音处理领域中新近发展起来的一个学科分支,本文主要研究了语音信号处理技术中的两个主要内容:语音时长规整技术和说话人特征改变技术。语音时长规整技术就是在不改变语音音调并保证良好音质的前提下,随意地改变语音播放速度,就仿佛说话人自己在改变说话速度一样。说话人特征改变技术是语音处理中一个比较新的交叉边缘分支,主要是通过对合成语音进行适当语音参数控制和调整来实现的。针对语音时长规整技术,研究了固定同步重叠叠加(SOLAFS)算法中合成相邻帧间距ss和搜索总长度kmax的最佳参数选取,实验表明ss的取值在不小于一个平均基音周期的同时不大于帧长与一个平均基音周期的差值;kmax的取值约为一个平均基音周期。在此基础上得出了人耳对基音同步的感知存在一定的容差从而改进了二次谱提取基频算法,提高了基频提取的准确度,进一步提出了一种新的基于改进二次谱的语音时长规整算法,与SOLAFS算法相比,该算法在保持规整后语音质量的同时,有效降低了整体计算复杂度。针对说话人特征改变技术,提出了一种基于重采样的基频改变算法,该算法简单有效,整体计算复杂度较低;提出了一种非等比例调整前三个共振峰的方法,独立调整前三个共振峰的同时保证了信号总能量不变;提出了一种男女声频谱倾斜差异补偿方法,提高了男声变女声时输出语音的自然度。融合所研究的各种特征参数改变方法,构建了基于倒谱的说话人特征改变系统。最后采用混合编程方式,实现了集语音时长规整技术和说话人特征改变技术于一体的语音信号处理软件。本软件采用VC++和Matlab混合编程的思想,利用该软件,可以实现对输入语音进行变速和变声处理两个功能。在变声处理中,可以实现男声、女声、童声和老人声等之间的快速转换,也可以手动设置特征参数,进行其他要求的语音特征改变,如同性别之间的语音特征改变等。除此之外,还可以实现现场变速变声等其他功能。
论文目录
摘要ABSTRACT第一章 引言1.1 研究背景及选题意义1.2 国内外研究动态1.2.1 语音时长规整技术研究动态1.2.2 说话人特征改变技术研究动态1.3 论文研究的主要内容1.4 论文结构安排第二章 语音时长规整技术研究与实现2.1 语音信号处理基础理论2.1.1 语音信号的基本特性2.1.2 语音信号的预处理2.1.3 语音音质评价方法2.2 时域法原理及仿真实现2.2.1 重叠叠加算法2.2.2 固定同步重叠叠加算法2.3 SOLAFS算法参数选取研究s的选取'>2.3.1 合成后相邻帧间距ss的选取max的选取'>2.3.2 搜索总长度kmax的选取2.4 人耳对基音同步的感知问题2.5 改进的二次谱基频提取算法2.6 基于改进二次谱提取基频的时长规整算法2.7 本章小结第三章 说话人特征改变技术研究与实现3.1 语音信号处理基础理论3.1.1 语音信号的发生机理和产生模型3.1.2 语音信号的基本分析方法3.1.3 语音音质评价方法3.2 一种基于重采样的基频改变算法3.2.1 算法原理3.2.2 仿真实验3.3 基于谱包络估计的共振峰提取3.3.1 LPC提取谱包络原理3.3.2 倒谱提取谱包络原理3.3.3 仿真实验3.4 基于谱包络压扩的共振峰改变3.4.1 等比例压扩谱包络3.4.2 分段等比例压扩谱包络3.5 一种男女声频谱倾斜差异补偿方法3.5.1 算法原理3.5.2 仿真实验3.6 基于倒谱的说话人特征改变系统3.6.1 LPC模型分析3.6.2 系统框图3.6.3 实现步骤3.6.4 仿真实验3.7 本章小结第四章 语音信号改变软件的实现4.1 总体设计方案4.2 实现方法4.3 本章小结第五章 总结和展望5.1 全文工作总结5.2 未来研究展望致谢参考文献学位论文评阅及答辩情况表
相关论文文献
标签:语音信号论文; 时长规整论文; 基音检测论文; 共振峰调整论文; 频谱倾斜补偿论文;