H.264快速运动估计算法及其在CUDA上的实现

H.264快速运动估计算法及其在CUDA上的实现

论文摘要

ISO/IEC和ITU-T联合制定的新一代视频压缩标准H.264可以获得很高的编码效率,但却大大增加了编码复杂度,对视频编码的实时性带来了很大的挑战。在高实时应用系统中,必须对该标准进行相应的改进。改进的方法可以从两个方面考虑,一方面通过对编码算法的改进,降低编码时间,提高编码速度,另一方面采用相关协处理设备与CPU协同编码,从而提高系统实时性。运动估计是H.264编码标准的核心技术之一,编码时间占很大比例。本文总结了几种经典的运动估计算法,并在此基础上了提出了一种高效的快速运动估计算法----改进的UMHEX算法。该算法采用了提前终止阈值,改进的搜索模板和基于混合模板的搜索技术。通过实验表明,改进的算法与全搜索算法和UMHEX算法相比,在保持信噪比和码率几乎不变的情况下,编码时间明显降低了。图形处理器GPU具有强大的浮点计算能力和并行处理能力,能够很好地协同CPU完成视频编解码。在解码器中,将去方块滤波放入GPU中进行并行计算,其余部分仍在CPU中计算,从而提出了CPU+GPU的并行解码器结构。本文充分利用了GPU的并行计算能力,使得去方块滤波的计算时间大大缩短。实验表明,这种并行架构与传统的算法相比,能够有效地进行编码加速。不管是对算法本身的改进或是通过协处理器进行并行处理,都能够有效地提高编码速度,改进系统的实时性,从而使得H.264视频编码标准能够很好地应用到实际场合中。

论文目录

  • 摘要
  • 英文摘要
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 研究意义
  • 1.3 论文的组织结构
  • 第二章 视频压缩编码原理
  • 2.1 H.264视频编码基本原理
  • 2.2 H.264标准的关键技术
  • 2.2.1 帧内预测
  • 2.2.2 帧间预测
  • 2.2.3 整数DCT变换
  • 2.2.4 量化
  • 2.2.5 去方块滤波
  • 2.2.6 熵编码
  • 2.3 H.264的主要特征
  • 第三章 运动估计算法
  • 3.1 运动估计与运动补偿原理
  • 3.1.1 整数像素运动搜索原理
  • 3.1.2 1/4像素运动搜索原理
  • 3.2 影响运动估计效率的因素
  • 3.2.1 初始搜索点的选择
  • 3.2.2 运动估计的块匹配准则
  • 3.2.3 运动搜索算法
  • 3.3 经典运动估计算法
  • 3.3.1 全搜索法
  • 3.3.2 三步搜索法
  • 3.3.3 改进的三步搜索法
  • 3.3.4 四步搜索法
  • 3.3.5 菱形搜索法
  • 3.3.6 六边形搜索法
  • 第四章 多核处理器CUDA架构
  • 4.1 图像处理器GPU
  • 4.1.1 GPU发展史
  • 4.1.2 CPU与GPU性能比较
  • 4.1.3 GPU的特点
  • 4.2 CUDA设计基础
  • 4.3 CUDA编程模型
  • 第五章 快速运动估计算法
  • 5.1 UMHexagonS算法
  • 5.2 搜索起始点预测
  • 5.3 不同模板的选取
  • 5.4 算法步骤
  • 5.5 实验结果与分析
  • 第六章 H.264去方块滤波在CUDA上的实现
  • 6.1 去方块滤波的原理
  • 6.2 H.264可并行化选择
  • 6.3 去方块滤波的并行化设计
  • 6.4 实验结果与分析
  • 第七章 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表学术论文情况
  • 相关论文文献

    标签:;  ;  ;  ;  

    H.264快速运动估计算法及其在CUDA上的实现
    下载Doc文档

    猜你喜欢