高效视频编码的算法优化及其扩展研究

高效视频编码的算法优化及其扩展研究

论文摘要

H.264是ITU-T的VCG和ISO的MPEG最近联合开发的新一代视频编码标准。H.264出色的编码效率和有效的传输接口使得它可以广泛应用于IP网络和无线网络上的视频业务。H.264存在着与早期的视频编码标准相似地研究课题。首先,编码效率在比以前标准提高50%的同时,复杂度也增加了一个数量级。如何减少计算复杂度对H.264标准的实时应用尤为重要。其次,H.264码率控制方案假设视频序列的帧与帧之间有一定的相关性,可以用前面的编码产生的统计信息指导当前帧的码率控制。然而,视频序列帧与帧之间统计特性千差万别,尤其在场景切换或者运动剧烈的情况时,前后帧之间的相关性消失或明显减弱。这造成了序列前后编码帧的图像质量有明显的波动。如何改进码率控制方案以降低前后帧解码图像的波动对H.264的应用也尤为重要。最后,H.264在提高50%编码效率的同时,编码复杂度也增加了十几倍。单纯从基于混合编码框架上来提高编码效率已越来越困难。近年来,国内外学者逐渐加大了将人眼视觉特性应用到视频编码中的研究力度,以在进一步提高编码效率的同时,改善图像的主观质量。如何将人眼视觉特性融合于编码系统中,将是视频编码技术发展的一个重要问题。为此,本文将从降低编码复杂度、码率控制、视觉编码这三方面进行研究以优化H.264的编码算法。第一,基于H.264实时应用,本文对H.264编码算法进行优化。针对编码过程复杂度高的整数变换与量化、运动估计、预测模式选择、参考帧选择等模块进行深入的研究与分析,首先在像素域内充分利用纹理特性、相邻块的相关性以及已编码块的信息等,给出了一套快速算法,有效地减少编码器的运算量。接着从运动场的空域、时域分布的角度出发,基于帧内模式选择、帧间模式选择,参考帧选择与运动场空时一致的相关性,给出了一套快速算法,这套算法克服了在像素域利用纹理特性的快速编码算法的局限性。第二,基于帧层、GOP层码率分配存在的局限性,本文对H.264码率控制提出了改进。给出了一种基于增量式PID和帧复杂度的帧层目标比特分配方案。首先,引入增量式PID对缓冲区“液面”进行控制,减小由于缓冲区“液面”波动带来对帧层目标比特分配的负面影响。接着,给出了基于帧复杂度的目标比特分配方案,其中采用前一帧MAD、前一帧时域活动度以及当前帧时域活动度来来预测当前帧的复杂度。本方案可使视频质量PSNR的波动平均降幅32%;给出了一种基于增量式PID算法GOP层目标比特分配方案。给出的GOP层目标比特分配方案使PSNR的波动的平均降幅达15%。第三,本文研究了如何将人眼视觉关注度特性引入到视频编码中,以在进一步提高编码效率的同时,改善图像的主观质量。提出了一种基于人眼视觉关注度的视频编码方法。该方法首先快速分割局部运动宏块、边缘宏块、平滑宏块和纹理宏块。接着,基于人眼视觉关注度高低,对不同区域宏块的量化参数进行调整。本方法在提高视频主观质量的同时,可降低10%左右的码率:提出了一种基于人眼视觉关注度的H.264码率控制算法。算法首先提出了基于运动关注度帧层目标比特分配方案,增加运动剧烈帧分配的比特数,降低运动平缓帧分配的比特数。接着,提出了基于人眼视觉关注度的宏块层目标比特分配,增加关注区域宏块的目标比特数,降低非关注以及能够掩盖更多失真区域宏块的目标比特数。本方法在降低视频质量波动的同时,关注区域的PSNR也有大幅提高,从而有效的改善了视频图像的主观质量。

论文目录

  • 摘要
  • ABSTRACT
  • 英文缩略词
  • 第一章 绪论
  • 1.1 引言
  • 1.2 视频编码技术与视频编码标准
  • 1.2.1 视频编码的技术及其发展
  • 1.2.2 视频编码的国际标准
  • 1.3 本课题研究的意义
  • 1.3.1 研究H.264标准编码算法优化的意义
  • 1.3.2 研究H.264码率控制的意义
  • 1.3.3 研究基于人眼视觉关注特性H.264编码的意义
  • 1.4 本文研究的内容和研究创新成果
  • 第二章 H.264编码算法优化的研究
  • 2.1 引言
  • 2.2 基于H.264的全零块预先判决
  • 2.2.1 整数变换与量化的原理
  • 2.2.2 全零块检测技术的研究现状及方法概述
  • 2.2.3 对 H.264中全零块的预先判决
  • 2.2.4 实验结果
  • 2.3 对 H.264中亚像素运动估计的优化
  • 2.3.1 引言
  • 2.3.2 亚像素搜索跳过策略
  • 2.3.3 自适应快速亚像素搜索的流程
  • 2.3.4 实验结果
  • 2.4 对 H.264中帧内预测模式选择的优化
  • 2.4.1 引言
  • 2.4.2 快速帧内预测模式选择算法
  • 2.4.3 实验结果
  • 2.5 对 H.264中帧间预测模式选择的优化
  • 2.5.1 引言
  • 2.5.2 快速帧间预测模式选择算法
  • 2.5.3 实验结果
  • 2.6 对 H.264参考帧选择的算法优化
  • 2.6.1 引言
  • 2.6.2 快速的H.264参考帧的选择算法
  • 2.6.3 实验结果
  • 2.7 小结
  • 第三章 基于运动场分布的H.264编码算法优化
  • 3.1 引言
  • 3.2 可选择的帧内编码
  • 3.2.1 引言
  • 3.2.2 基于 Sobel边缘检测算子运动场空域特性的分析
  • 3.2.3 可选择的帧内编码算法
  • 3.2.4 实验结果
  • 3.3 基于运动场空域相关性的帧间编码模式选择
  • 3.3.1 引言
  • 3.3.2 基于运动场空域相关性的帧间编码模式选择算法
  • 3.3.3 实验结果
  • 3.4 基于运动场时/空相关性的参考帧选择
  • 3.4.1 引言
  • 3.4.2 基于运动场时空相关性的参考帧选择
  • 3.4.3 实验结果
  • 3.5 小结
  • 第四章 H.264码率控制改进方法的研究
  • 4.1 引言
  • 4.2 H.264码率控制研究现状
  • 4.2.1 H.264码率控制中的线性预测模型
  • 4.2.2 GOP层码率控制
  • 4.2.3 Frame层码率控制
  • 4.2.4 基本单元层码率控制
  • 4.3 H.264 GOP层码率分配的改进研究
  • 4.3.1 GOP层码率控制的局限性
  • 4.3.2 增量式 PID控制的原理
  • 4.3.3 基于增量式PID的GOP层码率控制
  • 4.3.4 实验结果
  • 4.4 H.264 Frame层码率分配的改进研究
  • 4.4.1 Frame层码率控制的局限性
  • 4.4.2 基于增量式 PID的Frame层码率控制
  • 4.4.3 基于帧复杂度的Frame层码率控制
  • 4.4.4 实验结果
  • 4.5 小结
  • 第五章 基于人眼视觉关注度的视频编码方法
  • 5.1 引言
  • 5.2 人眼的视觉关注特性
  • 5.3 基于人眼视觉关注度的视频编码
  • 5.3.1 人眼视觉关注度的提取
  • 5.3.2 基于人眼视觉关注度的自适应量化算法
  • 5.3.3 基于人眼视觉关注度的码率控制算法
  • 5.4 小结
  • 第六章 总结与展望
  • 参考文献
  • 作者在攻读博士学位期间的成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    高效视频编码的算法优化及其扩展研究
    下载Doc文档

    猜你喜欢