新一代视频编码技术研究

新一代视频编码技术研究

论文摘要

H.264/AVC视频编码标准问世以后,国际标准化组织致力于新一代视频编码标准的研究制定。正在研究制定的新一代视频编码标准是高性能视频编码标准和三维立体视频编码标准。本文研究了提高高性能视频编码以及三维立体视频编码效率的多项技术。针对高性能视频,提出了两种提高编码效率的编码方法;针对三维立体视频,提出了虚拟视图的失真模型,并依据该模型设计了一种接近最优的纹理图与深度图的联合码率分配算法。本文的主要研究内容和成果如下:1.解码端可推导的帧内预测模式在H.264/AVC的帧内预测中,对于一些编码块,不论是哪种帧内预测模式,往往有相似的预测结果。对于这样的一些块,提出将所有的帧内预测模式得到的预测值加权平均作为该块的预测值。这种新的帧内预测模式,不必采用率失真优化就可以得到最终的预测结果,降低了编码复杂度;并且不必编码预测模式信息,降低了编码比特数。实验结果表明,与H.264/AVC帧内预测方法相比,在恢复视频质量相同的条件下,提出的方法编码比特率平均下降2.62%,编码复杂度平均下降39.25%。2.针对变焦运动的位移矢量预测变焦运动是指视频中物体的大小呈现由近致远或者由远至近的渐变运动,这是视频中经常发生的现象。依据摄像机成像的几何原理,推导了变焦运动的数学模型。在该模型的基础上,设计了一种适用于变焦运动的位移矢量预测器。对于含有变焦运动的实验序列,实验结果表明,相比H.264/AVC,提出方法的编码效率更高。在恢复视频质量相同的条件下,采用CABAC熵编码时编码比特率最多可减少7.66%,平均减少4.9%。3.三维立体视频编码中的合成虚拟视图失真模型详细分析了合成虚拟视图失真与邻近视点视图的纹理视频和深度图的压缩失真之间的关系。合成虚拟视图的失真由三个部分组成,纹理视频的压缩失真引起的虚拟视图失真,深度图的压缩失真引起的虚拟视图失真,以及深度图固有的几何失真引起的虚拟视图失真。通过分析发现合成虚拟视图的失真与纹理视频的压缩失真、深度图的压缩失真之间都存在线性关系,并由此确定了合成虚拟视图的失真模型。实验结果验证了提出模型的准确性,由该模型计算所得的虚拟视图失真与真实的虚拟视图失真之间的拟合系数全部高于0.98,最大的拟合误差(采用MSE衡量)仅为2.4828。4.基于模型的纹理视频与深度图联合码率分配算法在总的编码码率确定的情况下,纹理视频与深度图的码率分配对合成虚拟视图质量产生严重影响,是三维立体视频编码中的关键技术之一。采用提出的虚拟视图失真模型设计了一种接近最优的纹理视频与深度图联合码率分配算法。依据提出的虚拟视图失真模型,将纹理视频与深度图之间的联合码率分配问题表示为约束最优化的数学问题,采用拉格朗日乘数法确定了该问题的最优解,进而为纹理视频和深度图分配码率。提出的算法无需遍历所有的量化参数,仅需要简单计算即可实现最优的纹理视频与深度图的码率分配,极大的降低了计算复杂度。实验结果表明提出的算法率失真性能接近基于搜索的码率分配算法的率失真性能,但是其复杂度仅为基于搜索的码率分配算法的7.69%。

论文目录

  • 摘要
  • Abstract
  • Chapter 1 Introduction
  • 1.1 Background and Motivations
  • 1.2 Description and Contributions of the Thesis
  • Chapter 2 Related Works
  • 2.1 Introduction
  • 2.2 Related Works for 2D Video Coding
  • 2.2.1 Intra Coding Technologies
  • 2.2.2 Inter Coding Technologies
  • 2.2.3 Transform
  • 2.2.4 Other Technologies
  • 2.3 Related works of 3D video coding
  • 2.3.1 Depth maps coding
  • 2.3.2 Joint coding between texture videos and depth maps
  • Chapter 3 Technologies for High Performance Video Coding, Part I: Decoder Side Prediction Mode Derivable Intra Coding Method
  • 3.1 Introduction
  • 3.2 Intra Prediction Modes of H.264/AVC
  • 3.3 Decoder Side Prediction Mode Derivable Intra Coding Method
  • 3.4 Experimental Results
  • 3.5 Conclusions
  • Chapter 4 Technologies for High Performance Video Coding, Part II: Model Based Motion Vector Predictor for Zoom Motion
  • 4.1 Introduction
  • 4.2 Zoom Motion Analyses
  • 4.2.1 Global Zoom Motion
  • 4.2.2 Local Zoom Motion
  • 4.3 Model Based MVP for Zoom Motion
  • 4.4 Experimental Results
  • 4.5 Conclusions
  • Chapter 5 Technologies for 3D Video Coding, Part I: Distortion Model of Synthesized Virtual Views
  • 5.1 Introduction
  • 5.2 Background and Preliminaries
  • 5.3 Distortion Model of Synthesized Virtual Views
  • 5.3.1 Decomposition of Virtual View’s Distortion
  • 5.3.2.F urther Analysis on Virtual View’s Distortion
  • 5.3.3.D istortion Model of the Synthesized Virtual View
  • 5.4 Distortion Model Verification
  • 5.6 Conclusions
  • Appendix A
  • Appendix B
  • Appendix C
  • Chapter 6 Technologies for 3D Video Coding, Part II: Model based Joint Bit Allocation between Texture Videos and Depth Maps
  • 6.1 Introduction
  • 6.2 Formulation of the Joint Bit Allocation Problem
  • 6.2.1 Relationship among Dv, Qt and Qd
  • 6.2.2 Rt-Qt and Rd-Qd Models
  • 6.3 Solution of the Joint Bit Allocation Problem
  • 6.4 Experimental Results
  • 6.5 Conclusions
  • Chapter 7 Conclusions and Prospects
  • Acknowledgements
  • Bibliography
  • Publication List
  • 附录:论文主要内容
  • 相关论文文献

    • [1].基于纹理信息引导的光场深度图优化[J]. 电视技术 2020(07)
    • [2].基于立体视觉的目标深度图提取算法研究[J]. 测绘与空间地理信息 2020(04)
    • [3].基于导向滤波的深度图优化方法[J]. 导航与控制 2018(01)
    • [4].基于置信度的深度图融合[J]. 四川大学学报(工程科学版) 2016(04)
    • [5].2维至3维图像/视频转换的深度图提取方法综述[J]. 中国图象图形学报 2014(10)
    • [6].基于纹理信息与深度图空时梯度的深度图上采样算法[J]. 铁道学报 2015(07)
    • [7].一种深度图失真引入的虚拟视失真估计方法[J]. 上海大学学报(自然科学版) 2015(04)
    • [8].基于深度图压缩的边界自适应上采样方案[J]. 计算机与现代化 2014(05)
    • [9].一种用于深度图编码的虚拟视失真估计模型[J]. 光电子.激光 2014(07)
    • [10].基于图割的高质量深度图获取方法[J]. 电视技术 2011(15)
    • [11].基于深度图的影像密集匹配算法的改进[J]. 测绘与空间地理信息 2019(06)
    • [12].一种时间一致性立体视频深度图序列估计算法[J]. 计算机应用研究 2015(10)
    • [13].恰可察觉深度差异模型的深度图优化方法[J]. 光电子.激光 2012(07)
    • [14].基于双通道卷积神经网络的深度图超分辨研究[J]. 光学学报 2018(10)
    • [15].一种基于置信度的深度图融合方法[J]. 现代计算机(专业版) 2016(35)
    • [16].基于边缘复杂度的深度图帧内模式选择方法[J]. 杭州电子科技大学学报(自然科学版) 2016(06)
    • [17].一种深度图的时域下采样编码及重建方法[J]. 西安电子科技大学学报 2016(04)
    • [18].一种基于局部直方图匹配的深度编码滤波算法[J]. 软件导刊 2016(09)
    • [19].基于前景背景分离的深度图获取技术研究[J]. 电脑迷 2018(09)
    • [20].深度图时域一致性增强[J]. 光电子.激光 2014(01)
    • [21].不同姿态人脸深度图识别的研究[J]. 电子测量与仪器学报 2011(10)
    • [22].双目立体测量中多视角深度图同时融合算法[J]. 计算机辅助设计与图形学学报 2008(11)
    • [23].基于双目视觉的深度图拼接[J]. 激光与光电子学进展 2018(12)
    • [24].三维视频的深度图快速编码算法[J]. 通信技术 2018(03)
    • [25].面向三维视频系统的深度图压缩方法研究[J]. 宁波大学学报(理工版) 2009(03)
    • [26].一种基于虚拟视点合成的快速深度图编码方法[J]. 数据通信 2016(03)
    • [27].利用视频与深度图相关性的深度图帧内编码[J]. 西安电子科技大学学报 2015(03)
    • [28].图像引导的二阶总广义变分稀疏深度图的稠密重构[J]. 计算机科学 2015(07)
    • [29].非规则投影屏幕的深度图获取与优化[J]. 产业科技创新 2020(20)
    • [30].基于微分不变量和区域增长法的深度图分割[J]. 计算机工程 2008(19)

    标签:;  ;  ;  ;  ;  

    新一代视频编码技术研究
    下载Doc文档

    猜你喜欢