基于内容的高效帧内编码技术研究

论文摘要

可独立解码的视频帧内编码帧(Ⅰ帧)具有作为随机访问点、防止错误传播等重要功能,因而在视频应用中扮演着至关重要的角色,现今一些高质量视频应用例如数字电影中也有直接使用全Ⅰ帧编码的情况。然而Ⅰ帧较低的压缩比与其重要程度形成了一对亟待解决的矛盾。近年来,最先进的帧内编码技术多是基于H.264/AVC国际视频编码标准所采用的混合视频帧内编码框架所提出的。因此,从理论上深入理解并完善信源编码理论在混合视频帧内编码框架中的应用,并在此基础上研究提出工程可实现的高效帧内编码算法具有十分重要的理论与现实意义。在理论分析方面,本文认为混合视频帧内编码框架将一帧图像的信源熵用链式法则拆解为多个像素块条件熵之和,并通过帧内预测技术来去除像素块之间的互信息实现对条件熵的逼近；在编码每个像素块时,通过变换技术将块内像素映射为互不相关的变换域信源符号,最后应用熵编码技术对每个变换域信源符号逼近其信息熵。由于帧内预测技术和变换技术中所期望去除的信源符号间互信息很难定义和表达,因此工程上常常以线性相关性代替互信息作为技术优化目标,本文分析讨论了互信息与线性相关性的关系以及这种工程近似方法的合理性。作为对上述相对抽象层面理论分析的延伸,本文更具体地研究了在一个特定的视频图像区域上如何获得最佳的单一模式帧内预测和变换的联合。事实上,最佳的帧内预测就是能完全去除参考像素与当前编码块目标像素之间线性相关性的维纳滤波器,而对应于该最佳预测的最佳联合变换即为在该预测所获得的残差上统计生成的KLT变换。在理论研究的基础上,本文进一步针对帧内预测这一重要技术环节,提出了三种新的高效技术方案,这三种技术都应用了本文之前所讨论的在一个特定视频图像区域上生成最优帧内预测模式的算法。三种帧内预测技术方案有各自适合的应用条件,普通自适应帧内预测技术需要额外编码传输较大量的预测滤波器信息,因此主要适用于高分辨率且纹理细节复杂独特的视频序列；解码端导出自适应帧内预测模式技术无须传输额外滤波器信息,因而可适用于更宽广的分辨率范围,但对解码端的计算能力要求很高；固定预测滤波器系数技术的预测滤波器在线下统计训练得到因而具有最低的编解码复杂度,但其性能取决于编码序列和训练集之间的相似性,难以保证在所有类型的视频序列下都性能良好。实验证明,在对应的应用条件下,三种技术相比当前最先进的国际视频编码标准H.264/AVC均能取得明显的性能增益(尤其是在高分辨率纹理细节复杂的视频序列上)。

论文目录

致谢

摘要

Abstract

图目录

表目录

1 绪论

1.1 视频图像编码概述

1.2 主流视频帧内编码技术框架

1.3 最新研究成果

1.3.1 双向预测技术（BIP）

1.3.2 基于位移搜索的帧内预测（DIP）

1.3.3 模版匹配技术（TM）

1.4 本文研究问题及论文组织

2 视频帧内编码的理论基础

2.1 信源编码的信息论基础

2.2 混合视频帧内编码框架的理论分析

2.2.1 信源符号的定义

2.2.2 去除互信息以及自信息的技术环节透析

2.2.3 用线性相关性近似互信息的工程实现

2.3 小结

3 最优联合帧内预测及变换的理论研究

3.1 单模式最优联合帧内预测变换证明

3.1.1 问题的数学模型及定义

3.1.2 最优联合帧内预测变换证明

3.2 小结

4 基于统计特性的帧内预测新算法研究与实现

4.1 普通自适应帧内预测技术

4.1.1 技术方案

4.1.2 理论有效性分析

4.1.3 性能测试与讨论

4.2 解码端导出自适应帧内预测模式

4.2.1 技术方案

4.2.2 理论正确性分析

4.2.3 性能测试与讨论

4.3 固定预测滤波器系数

4.3.1 技术方案

4.3.2 性能测试与讨论

4.4 小结

5 结论

参考文献

在学期间所取得的科研成果

基于内容的高效帧内编码技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢