论文摘要
ISO/IEC和ITU-T联合制定的新一代视频压缩标准H.264可以获得很高的编码效率,但却大大增加了编码复杂度,对视频编码的实时性带来了很大的挑战。在高实时应用系统中,必须对该标准进行相应的改进。改进的方法可以从两个方面考虑,一方面通过对编码算法的改进,降低编码时间,提高编码速度,另一方面采用相关协处理设备与CPU协同编码,从而提高系统实时性。运动估计是H.264编码标准的核心技术之一,编码时间占很大比例。本文总结了几种经典的运动估计算法,并在此基础上了提出了一种高效的快速运动估计算法----改进的UMHEX算法。该算法采用了提前终止阈值,改进的搜索模板和基于混合模板的搜索技术。通过实验表明,改进的算法与全搜索算法和UMHEX算法相比,在保持信噪比和码率几乎不变的情况下,编码时间明显降低了。图形处理器GPU具有强大的浮点计算能力和并行处理能力,能够很好地协同CPU完成视频编解码。在解码器中,将去方块滤波放入GPU中进行并行计算,其余部分仍在CPU中计算,从而提出了CPU+GPU的并行解码器结构。本文充分利用了GPU的并行计算能力,使得去方块滤波的计算时间大大缩短。实验表明,这种并行架构与传统的算法相比,能够有效地进行编码加速。不管是对算法本身的改进或是通过协处理器进行并行处理,都能够有效地提高编码速度,改进系统的实时性,从而使得H.264视频编码标准能够很好地应用到实际场合中。
论文目录
摘要英文摘要第1章 绪论1.1 研究背景1.2 研究意义1.3 论文的组织结构第二章 视频压缩编码原理2.1 H.264视频编码基本原理2.2 H.264标准的关键技术2.2.1 帧内预测2.2.2 帧间预测2.2.3 整数DCT变换2.2.4 量化2.2.5 去方块滤波2.2.6 熵编码2.3 H.264的主要特征第三章 运动估计算法3.1 运动估计与运动补偿原理3.1.1 整数像素运动搜索原理3.1.2 1/4像素运动搜索原理3.2 影响运动估计效率的因素3.2.1 初始搜索点的选择3.2.2 运动估计的块匹配准则3.2.3 运动搜索算法3.3 经典运动估计算法3.3.1 全搜索法3.3.2 三步搜索法3.3.3 改进的三步搜索法3.3.4 四步搜索法3.3.5 菱形搜索法3.3.6 六边形搜索法第四章 多核处理器CUDA架构4.1 图像处理器GPU4.1.1 GPU发展史4.1.2 CPU与GPU性能比较4.1.3 GPU的特点4.2 CUDA设计基础4.3 CUDA编程模型第五章 快速运动估计算法5.1 UMHexagonS算法5.2 搜索起始点预测5.3 不同模板的选取5.4 算法步骤5.5 实验结果与分析第六章 H.264去方块滤波在CUDA上的实现6.1 去方块滤波的原理6.2 H.264可并行化选择6.3 去方块滤波的并行化设计6.4 实验结果与分析第七章 总结与展望参考文献致谢攻读硕士学位期间发表学术论文情况
相关论文文献
标签:运动估计论文; 混合模板论文; 图形处理器论文; 并行处理论文;