基于视觉感知的H.264感兴趣区域编码研究

基于视觉感知的H.264感兴趣区域编码研究

论文摘要

视频编码技术是有效传输和存储视频信息的关键技术之一,是现代信息技术中不可或缺的重要组成部分。H.264/AVC(以下简称H.264)是ITU和ISO/IEC联合制定的最新视频编码标准。从视频编码技术的发展历程来看,如何在复杂度和时延受限的条件下,获得最优化的率失真性能,是视频编码设计的核心问题。研究人员先前主要从减少空间域冗余、时间域冗余和统计冗余三个方面来改善视频编码的率失真性能,而目前采用视觉处理、基于区域的视频编码技术是该领域的热点研究方向之一。视觉神经科学研究已经证明,人类视觉系统(Human VisualSystem,HVS)对视频场景的感知是有选择性的,不同的区域或者对象具有不同的视觉重要性。然而,传统的视频编码算法,在压缩视频图像时,并没有考虑HVS对视频场景感知的多样性。因此,对如何利用视觉感知原理来改善H.264视频编码算法的编码效果和计算效率这个问题进行深入研究,具有重要的理论意义和应用价值。本文正是在这种研究背景下,展开了基于视觉感知的H.264感兴趣区域编码算法的研究。第1章绪论部分首先阐述了选题的意义,然后对国内外研究现状进行了综述并作了相应的总结,最后介绍了本课题的主要研究内容和论文结构。第2章针对全局运动估计计算复杂度过高的问题,提出了一种基于运动矢量对消和差分原理的快速全局运动估计算法。该算法分为两个步骤,首先基于不同象限运动矢量对之间存在的对称抵消特性,估计出平移运动参数分量,然后使用运动矢量对的差分原理,并且结合一种置信判断的策略,估计出变换运动参数分量。全局运动参数的快速有效估计,为后续三章的研究工作奠定了基础。第3章提出了一种基于H.264编码域的移动区域检测算法,以运动矢量和像素差值的绝对值的和(Sum of Absolute Difference,SAD)等H.264编码辅助信息作为输入特征量,通过三个算法步骤实现对移动区域的检测。首先,通过全局运动估计及补偿处理和空间域-时间域两步运动矢量滤波方法,实现对运动显著区域的快速检测;然后通过对零运动矢量处的SAD建立χ2分布,采用基于F假设检验的变化检测方法,来快速检测包含小幅运动的移动区域;最后利用上述两步的检测结果计算出最终的移动区域分布图。移动区域的快速有效检测,为下一章运动感知子模型的研究奠定了基础。第4章提出了一种新颖的视觉感知模型,采用时间域和空间域的特征融合方式,计算视频场景的视觉感知图,有效模拟出HVS对视频场景的感知结果。该视觉感知模型由运动感知子模型、纹理感知子模型和空间位置感知子模型三部分构成。首先基于运动速度、运动方向、运动一致性和生物运动等视觉特征,对HVS的运动感知进行了建模,有效模拟HVS对移动区域的感知;接着基于HVS的视觉敏感度和视觉掩盖效应感知机制,对HVS的纹理感知进行了建模,有效模拟HVS对纹理复杂度的感知;然后基于HVS的中央凹和眼动控制感知机制,对HVS的空间位置感知进行了建模,实现了全局运动类型自适应的空间位置感知权重调整。第5章提出了一种基于视觉感知的H.264感兴趣区域编码算法,以视觉感知模型和H.264感兴趣区域编码器之间的信息共享为基础,首先采用已提出的视觉感知模型计算视觉感知图,然后进行基于视觉感知图的比特资源分配和计算资源分配,实现了H.264编码效果的改善,及计算效率的提高。在比特资源分配算法中,首先根据HVS对高频信号失真不敏感的感知机制,研究并提出了一种自适应频率系数压制技术;然后分别从理论以及实验两方面分析了视频编码中比特资源的分布特性;最后基于视觉感知图和一种有效的整体编码控制策略,实现了编码效果的改善。在计算资源分配算法中,在对H.264最优编码模式与视频场景内容特征的内在关联进行实验分析的基础上,根据视觉感知图和全局运动类型,研究并提出了一种高效的H.264快速模式分析算法,实现了计算效率的提高。第6章总结了本论文的研究成果和创新点,并提出了进一步研究的方向和任务。

论文目录

  • 致谢
  • 摘要
  • Abstract
  • 目录
  • 1 绪论
  • 1.1 选题的意义
  • 1.2 国内外研究现状
  • 1.2.1 视觉感知原理及其在视频处理领域的应用
  • 1.2.2 视觉感知分析和感兴趣区域编码
  • 1.2.3 移动区域检测和全局运动估计
  • 1.3 主要研究内容和论文结构
  • 1.3.1 主要研究内容
  • 1.3.2 论文结构
  • 2 全局运动估计快速算法研究
  • 2.1 全局运动模型
  • 2.2 运动矢量组优化选择
  • 2.3 基于运动矢量对消和差分原理的快速全局运动估计
  • 2.3.1 平移参数T的估计
  • 2.3.2 变换参数A的估计
  • 2.4 实验结果和分析
  • 2.5 本章小结
  • 3 基于H.264编码域的移动区域检测算法研究
  • 3.1 基于H.264编码域的移动区域检测算法
  • 3.2 移动区域分布图1检测
  • 3.2.1 空间域运动矢量滤波
  • 3.2.2 时间域运动矢量滤波
  • 3.2.3 运动矢量滤波效果
  • 3.3 移动区域分布图2检测
  • 0,0的x2概率分布建立'>3.3.1 SAD0,0的x2概率分布建立
  • 3.3.2 基于F假设检验的变化检测
  • 3.4 移动区域分布图计算
  • 3.5 实验结果与分析
  • 3.5.1 移动区域分布图检测结果
  • 3.5.2 变化检测效果比较
  • 3.5.3 计算复杂度比较
  • 3.6 本章小结
  • 4 时空特征融合的视觉感知分析研究
  • 4.1 基于时空特征融合的视觉感知模型
  • 4.1.1 运动感知子模型
  • 4.1.2 纹理感知子模型
  • 4.1.3 空间位置感知子模型
  • 4.1.4 感知图的时空特征融合
  • 4.2 实验结果和分析
  • 4.2.1 视觉感知图计算结果
  • 4.2.2 视觉注意度分析
  • 4.2.3 视觉注意焦点提取结果比较
  • 4.3 本章小结
  • 5 基于视觉感知的H.264感兴趣区域编码研究
  • 5.1 基于视觉感知的H.264感兴趣区域编码算法
  • 5.2 基于视觉感知图的比特资源分配
  • 5.2.1 自适应频率系数压制
  • 5.2.2 视觉感知图修正
  • 5.2.3 比特资源分配特性分析
  • 5.2.4 面向比特资源分配的编码控制策略
  • 5.3 基于视觉感知图的计算资源分配
  • 5.3.1 H.264最优编码模式与视频图像内容特征
  • 5.3.2 计算资源分配方案
  • 5.4 实验结果和分析
  • 5.5 本章小结
  • 6 结论和展望
  • 6.1 结论
  • 6.2 展望
  • 参考文献
  • 攻读博士学位期间的主要研究成果
  • 相关论文文献

    • [1].MPEG-2转H.264高效转码器的实现[J]. 电脑知识与技术 2017(06)
    • [2].H.264运动估计算法及其FPGA实现[J]. 自动化应用 2016(01)
    • [3].H.264解码器帧内预测模块的优化[J]. 电视技术 2013(19)
    • [4].H.264在手机视频监控系统中的应用浅析[J]. 电脑知识与技术 2015(22)
    • [5].基于H.264的数据分割技术研究[J]. 漳州职业技术学院学报 2015(04)
    • [6].H.264解码器的帧内预测优化[J]. 电子科技 2016(04)
    • [7].一种高效的H.264反变换反量化结构设计[J]. 计算机系统应用 2013(01)
    • [8].基于FPGA的H.264帧内预测实现和优化[J]. 计算机工程 2012(07)
    • [9].基于龙芯3B的H.264解码器的向量化[J]. 电子技术 2010(10)
    • [10].一种可重构的H.264帧内预测硬件结构[J]. 微计算机信息 2009(03)
    • [11].基于背景检测技术的H.264运动估计优化方案[J]. 电视技术 2009(S2)
    • [12].基于H.264的视频会议芯片选型[J]. 电视技术 2008(03)
    • [13].基于H.264的码率控制的改进方法研究[J]. 浙江工业大学学报 2008(05)
    • [14].H.264帧内预测数据用于图像分析的可行性探索[J]. 武汉工业学院学报 2008(03)
    • [15].一种基于H.264的高清广告插播解决方案[J]. 广播电视信息 2015(06)
    • [16].一种H.264亚像素全搜索的改进算法[J]. 小型微型计算机系统 2013(04)
    • [17].一种改进的基于柯西模型的H.264码率控制方法[J]. 信号处理 2011(11)
    • [18].H.264码率控制跳帧算法研究[J]. 微处理机 2010(03)
    • [19].浅谈H.264视频编解码标准的先进性[J]. 渭南师范学院学报 2010(05)
    • [20].H.264便携式实时编解码器的设计[J]. 微计算机信息 2009(14)
    • [21].低码率下的H.264宏块级码率控制方法[J]. 计算机应用研究 2009(07)
    • [22].一种新的H.264运动估计快速搜索算法[J]. 现代电子技术 2009(19)
    • [23].基于H.264图像编码的语音编码[J]. 无线电工程 2009(10)
    • [24].基于H.264的多参考帧运动估计快速算法[J]. 计算机工程 2008(10)
    • [25].一种新颖的H.264帧内预测快速算法[J]. 北京邮电大学学报 2008(02)
    • [26].H.264帧间预测快速算法[J]. 计算机辅助设计与图形学学报 2008(06)
    • [27].基于H.264的运动估计快速算法研究[J]. 电子世界 2014(08)
    • [28].基于方向测度的H.264帧内预测快速算法[J]. 现代计算机(专业版) 2013(04)
    • [29].一种新型的H.264码率控制初始化方法[J]. 计算机测量与控制 2012(03)
    • [30].基于运动检测与H.264的智能监控系统设计与实现[J]. 南京邮电大学学报(自然科学版) 2012(01)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于视觉感知的H.264感兴趣区域编码研究
    下载Doc文档

    猜你喜欢