论文摘要
随着近年来自由视点电视和三维立体电视的升温,多视点视频编码(Multi-view Video Coding, MVC)作为其中的关键技术得到了学术界的关泛关注。由于多视点立体视频数据量庞大,为了达到优秀的压缩性能,基于H.264的MVC采取了复杂的预测结构和多种压缩技术,但同时也带来了高编码复杂度。其中,数量繁多的预测模式和低效的视差估计是制约MVC速度的瓶颈。本文针对MVC模式选择和视差估计提出了快速的算法,主要包括以下3个方面:1、提出基于深度信息的快速模式选择算法,通过分析模式分布特点和不同深度下模式分布的规律,对不同空间区域的宏块采用具有针对性的模式搜索策略。其中,三维空间在深度图的铺助下被分割为近景、中景和远景三个的空间区域。远景的分割采用了基于形态学的方法,该区域的宏块使用SKIP和Inter 16×16编码模式,仅进行视点内的搜索。中景和近景的分割采用了联合背景差分和帧间差分的方法,中景区域的宏块使用SKIP、Inter6×6和帧内编码模式,其它区域宏块使用全候选模式进行搜索。实验证明,该方案平均节省53.14%的编码时间。2、针对基于灰度匹配和基于尺度不变特征变换(Scale Invariant Feature Transform, SIFT)提取全局视差矢量效率低下的问题,提出利用有向快速特征及旋转二值描述子(Oriented FAST and Rotated Brief, ORB)的图像匹配算法提取全局特征矢量。ORB在特征点的提取上采用了快速角点提取算法,描述子采用旋转敏感的二值特征描述子,特征点之间的匹配通过计算汉明距离完成。实验结果表明,利用ORB进行全局视差矢量的提取是SIFT提取速度的5倍。3、分析了三维图像变换(3D Warping)技术在预测视差矢量上的作用,提出利用全局视差矢量和3D Warping优化视差估计的搜索起点,并联合全局视差矢量和3D Warping对视差矢量的方向进行预测,利用预测的结果优化视差估计的搜索范围的快速视差估计算法。分析了视差和深度的关系,在深度信息的辅助下,对视差估计的搜索起点和搜索范围进行了进一步的调整。本文提出的快速视差估计算法能在图像质量几乎不受影响的情况下平均节省40.54%的编码时间。本文充分利用了深度信息决策宏块的编码模式,联合多种视差矢量预测技术加速视差估计,并采取ORB加速全局视差矢量的计算。经实验验证,所述算法提高了编码速度,对于多视点视频编码具有较大的应用价值。