高质量的2kb/s波形内插语音编码算法研究

论文题目: 高质量的2kb/s波形内插语音编码算法研究

论文类型: 博士论文

论文专业: 模式识别与智能系统

作者: 李靓

导师: 鲍长春

关键词: 语音编码,波形内插,线性预测,特征波形,矢量量化

文献来源: 北京工业大学

发表年度: 2005

论文摘要: 语音编码是数字语音通信系统中最重要、最基本的核心功能之一,用以压缩语音信号的数字表示而使表达这些信号所需的比特数最小。就目前的语音编码现状而言,8kb/s 以上的技术已经标准化和产品化,4kb/s 的国际标准也正在制定中。然而,随着个人计算机和国际互联网的快速发展,在移动通信、多媒体通信以及计算机网络通信等领域还将需要具有通信质量的2kb/s 语音压缩技术。因此,研究如何在2kb/s 获得具有通信质量的重建语音是语音编码中一个十分重要的课题。本论文在特征波形内插(CWI)编码算法的基础上提出了一种高质量的2kb/s 波形内插(WI)语音编码算法,主要研究成果包括: (1) 研究了两种语音线谱频率(LSF)参数的矢量量化方法。利用LSF 参数的有序性,提出了一种基于二阶时间分解(TD)模型的高效LSF 参数量化方法。实验结果表明在平均编码速率为500b/s 时,该量化方法可以获得一个相对较低的平均谱失真和相对较高的算法平均总延时。为了保证较低的算法延时,只能对LSF 参数逐帧进行矢量量化。基于此,本文利用LSF 参数的帧内和帧间相关性,提出了一种编码速率为800b/s 的LSF 参数的预测式瞬时联合多级分裂矢量量化(PSJ_MSVQ)方案。该量化方案不仅保持了较高的量化性能,而且降低了码字搜索复杂度和码字存储容量。(2) 研究了一种用于WI 语音编码模型的基音检测算法。利用小波变换的优良性能和时域波形类似性方法,提出了一种基于二进小波变换和归一化自相关函数的基音周期检测算法(DWT_NACF_PDA),与G.729 语音编码标准中所采用的仅基于归一化自相关函数的基音检测算法相比,该算法在检测性能与计算复杂度上具有优势。接下来,以该算法为基础提出了一种基于二进小波变换和归一化互相关函数的基音检测算法(DWT_NCCF_PDA),并将其用于WI 语音编码模型的基音检测。实验分析表明,DWT_NCCF_PDA 的性能与基于NCCF 的基音检测算法(NCCF_PDA)相当,但优于DWT_NACF_PDA。主观听力测试结果表明DWT_NCCF_PDA 为确保2kb/s WI 语音编码算法产生高质量的重建语音奠定了基础。(3) 提出了特征波形(CW)及其功率的量化方案。为提高编码效率,编码时将功率归一化的CW 分解为慢渐变波形(SEW)和快渐变波形(REW)。通过利用SEW 和REW 的不同感性特点、合成分析(A-b-S)技术和感觉加权技术,提

论文目录:

摘要

Abstract

图例

表例

第1章绪论

1.1 引言

1.2 语音编码器的属性

1.2.1 编码速率

1.2.2 编码质量

1.2.3 延时

1.2.4 复杂度

1.2.5 带宽

1.2.6 已经标准化的语音编码

1.3 低速率语音编码

1.3.1 语音信号产生的源-系统模型

1.3.2 码激励线性预测(CELP)模型

1.3.3 参数编码模型

1.4 论文的研究意义和主要研究内容

1.5 本文安排

第2章波形内插语音编码

2.1 PWI原理

2.2 PWI主要代表算法

2.3 CWI原理

2.3.1 特征波形的定义

2.3.2 特征波形的提取

2.3.3 特征波形的对齐

2.3.4 特征波形的分解

2.3.5 特征波形的内插

2.4 CWI主要代表算法

2.4.1 第一类代表算法

2.4.2 第二类代表算法

2.4.3 其他代表算法

2.5 本文建议的WI语音编码算法

2.5.1 本文建议的WI编码器

2.5.2 本文建议的WI解码器

2.6 本章小结

第3章语音线谱频率参数的矢量量化

3.1 基于时间分解模型的LSF参数量化

3.1.1 语音的时间分解(TD)模型

3.1.2 LSF参数的时间分解(LSF_TD)方法

3.1.3 基于LSF_TD的LSF矢量量化方法

3.2 LSF参数的预测式瞬时联合多级分裂矢量量化(PSJ_MSVQ)

3.2.1 LSF参数的帧内和帧间预测

3.2.2 多级矢量量化

3.2.3 实验

3.3 本章小结

第4章语音信号的基音检测

4.1 引言

4.2 基于二进小波变换和归一化自相关函数的基音检测算法(DWT_NACF_PDA)

4.2.1 二进小波变换

4.2.2 小波变换用于基音周期检测的原理

4.2.3 小波函数的构造

4.2.4 利用二进小波变换和归一化自相关函数检测基音周期

4.3 用于WI语音编码的基音检测算法

4.3.1 算法描述

4.3.2 实验

4.4 本章小结

第5章特征波形及其功率的量化

5.1 引言

5.2 多码本方法

5.3 变维方法

5.3.1 截取和补零

5.3.2 矢量变维

5.3.3 带限内插

5.3.4 多项式拟合

5.3.5 离散余弦变换

5.3.6 讨论

5.4 REW量化

5.4.1 REW幅度谱的变维处理

5.4.2 REW幅度谱量化

5.4.3 REW相位谱模型

5.4.4 实验

5.5 SEW量化

5.5.1 SEW的减样

5.5.2 SEW幅度谱的变维处理

5.5.3 SEW幅度谱量化

5.5.4 SEW相位谱量化

5.6 CW功率量化

5.7 本章小结

第6章 2kb/s WI语音编码算法及其性能评价

6.1 比特分配

6.2 主观质量评价

6.2.1 DRT测试

6.2.2 主观A/B测试

6.2.3 非正式MOS分测试

6.3 复杂度

6.4 本章小结

第7章结论与展望

7.1 论文工作总结

7.2 论文的创新点

7.3 下一步工作考虑

参考文献

攻读博士学位期间发表的学术论文

攻读博士学位期间参加的科研项目和获奖情况

致谢

发布时间: 2005-09-21

参考文献

[1].甚低码率低延迟语音编码算法研究[D]. 张刚.太原理工大学2007
[2].延迟2.5ms 8Kbps语音编码算法研究[D]. 武淑红.太原理工大学2012
[3].低速率语音编码算法研究[D]. 计哲.清华大学2011
[4].基于感知的低速率语音编码算法研究[D]. 何伟俊.华南理工大学2016

高质量的2kb/s波形内插语音编码算法研究

猜你喜欢