MPEG-2到H.264/AVC视频转码及相关技术研究

MPEG-2到H.264/AVC视频转码及相关技术研究

论文摘要

MPEG-2和H.264/AVC是视频编解码技术发展过程中最具有代表性的两个视频编码标准。现有的大量MPEG-2视频信息在H.264解码端的再现,以及两种标准在现在及将来的一段时间内的共存,使得MPEG-2到H.264的转码成为近年来视频信息处理领域的热点。广播电视运营商希望在有限的带宽上传递尽可能多的节目,城市图像监控需要将不同标准编码器得到的视频数据信息进行交互,流媒体对视频信息实时性具有较高要求——这些实际应用领域均对MPEG-2/H.264转码从不同角度提出了多样化的技术要求。由于H.264的JM模型在对编码模式进行决策时,为了得到最好的RD性能,遍历了所有可能的编码模式——JM模型为了达到最高的压缩效率,在计算方面不计代价。因此,MPEG-2/H.264转码的关键问题在于如何利用MPEG-2解码过程中提取的码流信息为H.264简化编码提供依据,从而减小H.264重编码过程的复杂度。对于MPEG-2/H.264的转码而言,尤其在流媒体和实时监控等实际应用需求下,若重编码仍采用JM模型中的模式决策方案,其实时性会比较差。考虑到MPEG-2在编码时已经进行过一次模式决策和运动估计,这就使得在MPEG-2完全/部分解码过程中提取其运动信息为重编码的模式决策服务以降低算法复杂度成为了可能,这也是MPEG-2/H.264转码遵循的一个基本原则。本文的主要研究内容有:(1)MPEG-2/H.264帧内转码方法。本文提出一种基于MPEG-2 DCT系数反映出来的边缘信息来进行帧内编码的(预测)模式决策算法。此算法利用MPEG-2解码的DCT系数矩阵的直流系数决策H.264重编码的编码模式,利用MPEG-2DCT系数矩阵的交流系数一次性决策帧内编码的预测模式,避开了H.264的JM模型参考软件的高复杂度。本文首先从参考算法的理论基础进行分析,进而得到改进方案,在改进方案的基础上重新进行预测模式决策,在没有增加任何算法复杂度的基础上,得到了更好的转码RD性能。(2)本文进行了MPEG-2/H.264帧间转码的研究。目前MPEG-2/H.264帧间转码算法多是基于MPEG-2的运动向量和编码块模式的分析,很少重视MPEG-2预测残差和H.264重编码的模式之间的关系。本文从MPEG-2残差的DCT系数着手,分析MPEG-2残差和H.264预测模式之间的关系,并在此基础上考察MPEG-2的运动向量/预测运动向量与H.264预测模式的运动搜索中心/搜索范围之间的关系,提出一种全新的快速帧间转码算法。在此算法中,实验表明,本文提出的MPEG-2/H.264帧间转码算法与级联帧间转码算法相比较,在PSNR几乎没有下降的情况下,以平均码率增加5.7%的代价,换来转码复杂度2/3的降低。最重要的是,本文提出的帧间转码算法不需要任何预设门限值,也没有任何需要用后验方法得到的参数,因此非常有利于实时转码的实现。(3)考虑到MPEG-2/H.264转码后的视频信号通常还伴随着帧率变换的实际需求,本论文还对帧率转码作了研究。本文提出了一种基于分段约束的动态帧丢弃的帧率转码算法。分段约束保证了转码后码流的逻辑性。动态帧丢弃满足了人们对局部运动明显的图像所带来的信息的视觉需求。用当前帧和前一帧的帧活动性来预测后一帧的帧活动性大小,以决定后一帧是否保留下来进行重编码,提前决定帧的去留,有利于实时转码的实现。同时,针对其中可能涉及到的多帧丢弃问题,提出一种新的覆盖块选择方案,以使运动向量重建过程中的误差尽可能小。帧丢弃率越高,这种新的覆盖块选择方案的优势越明显。另外,本文还提出了针对此帧率转码算法的实现架构,为硬件实现提供了思路。(4)从整个转码系统的角度看,H.264的解码是整个转码系统的重要技术环节,因此,本论文还对H.264的熵解码的实现作了深入研究。在分析了H.264熵编码的原理和对象特点的基础上,本文提出一种并行的双控制器熵解码器结构。此解码器的重要特点在于采用了主从两个控制器,可以部分实现并行解码,以得到尽可能高的解码效率。实验表明,相比普通的基于码字解码的熵解码器,本文提出的基于语法元素的解码器在解码I帧、P帧和B帧时能够分别节省27.9%、18.2%和48.8%的时间。

论文目录

  • 摘要
  • ABSTRACT
  • 英文缩略语表
  • 第一章 绪论
  • 1.1 视频转码技术的研究意义
  • 1.2 视频转码器基本架构和技术综述
  • 1.2.1 码率转码器的基本结构
  • 1.2.2 空间分辨率转码器基本结构
  • 1.2.3 时间分辨率转码器基本结构
  • 1.2.4 容错性能转码器基本结构
  • 1.2.5 语法转码器基本结构
  • 1.2.6 其它视频转码类型
  • 1.3 本文的研究内容和主要成果
  • 1.3.1 论文研究目标和拟解决的关键问题
  • 1.3.2 本文的主要成果和创新点
  • 1.4 本文主要内容及章节安排
  • 第二章 MPEG-2/H.264 转码技术的基础理论和关键技术分析
  • 2.1 MPEG-2/H.264 转码技术基础
  • 2.1.1 MPEG-2/H.264 变换编码技术基础
  • 2.1.2 MPEG-2/H.264 帧内转码技术基础
  • 2.1.3 MPEG-2/H.264 帧间转码技术基础
  • 2.2 本章小结
  • 第三章 MPEG-2 到H.264/AVC 的帧内转码技术
  • 3.1 帧内预测转码研究现状
  • 3.2 基于DCT 系数方向特性的低复杂度全覆盖帧内预测转码算法
  • 3.2.1 基于宏块活动性的模式决策算法
  • 3.2.2 基于宏块方向特性的预测模式决策算法
  • 3.2.3 MPEG 帧内视频信号的DCT 模型及参数意义
  • 3.2.4 算法及实验结果分析
  • 3.3 本章小结
  • 第四章 MPEG-2 到H.264/AVC 的帧间转码技术
  • 4.1 MPEG-2/H.264 转码模式选择
  • 4.1.1 国内外研究现状
  • 4.1.2 基于残差DCT 系数边缘特性的模式选择算法
  • 4.1.3 与基于运动补偿后的DCT 系数边缘特性的比较
  • 4.2 MPEG-2/H.264 转码运动估计
  • 4.2.1 国内外研究现状
  • 4.2.2 基于编码模式的搜索中心决策算法
  • 4.2.3 基于编码模式的搜索范围决策算法
  • 4.3 基于转码模式选择和运动估计的综合实验及结果分析
  • 4.4 本章小结
  • 第五章 帧率转码
  • 5.1 视频帧率转码概述
  • 5.1.1 帧率转码的关键问题
  • 5.1.2 帧率转码的研究现状
  • 5.2 基于动态帧丢弃的帧率转码方案
  • 5.2.1 基于动态帧丢弃的帧率转码的研究现状
  • 5.2.2 基于分段约束的动态帧丢弃帧率转码算法
  • 5.2.3 实验及结果分析
  • 5.3 基于动态帧丢弃的帧率转码方案中的多帧丢弃问题
  • 5.3.1 多帧丢弃转码存在的问题
  • 5.3.2 多帧丢弃转码中的覆盖块选择算法
  • 5.3.3 实验及结果分析
  • 5.4 本章综合实验及结果分析
  • 5.5 本章小结
  • 第六章 H.264 的熵编码及解码实现
  • 6.1 H.264 的熵编码算法及二进制算术编码基础
  • 6.1.1 CABAC 熵编码概述
  • 6.1.2 二进制算术编码基础
  • 6.1.3 CABAC 解码思路分析
  • 6.2 H.264 的CABAC 解码器硬件设计平台
  • 6.2.1 国内外研究现状综述
  • 6.2.2 时间和存储优化的CABAC 解码器设计及实现
  • 6.2.3 实验及结果分析
  • 6.3 本章小结
  • 第七章 总结和展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间已发表或录用的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    MPEG-2到H.264/AVC视频转码及相关技术研究
    下载Doc文档

    猜你喜欢