图像和视频的便捷抠图技术研究

图像和视频的便捷抠图技术研究

论文摘要

抠图(matting)是图像和视频处理的一项重要的技术,在医疗诊断、电影特效和家庭娱乐中,获得了广泛的应用。传统的数字抠图方法要求用户在原始图像上交互地指出确定的前景区域、确定的背景区域和不确定区域,作为初始的输入信息。这种初始信息输入图称为三分图(trimap),抠图算法在三分图的基础上进行优化。因此,三分图制作的质量将直接影响到最终的抠图结果。然而,手工制作一张合适的三分图需要大量的交互。对于一张复杂的图像,例如蜘蛛网等,制作一张最优的三分图则更加困难。如果对于一段视频序列,也逐帧地手工制作三分图,工作量更是难以想像。本文面向电影特效和家庭娱乐等应用领域,对图像和视频的便捷抠图技术展开研究,既要减少用户的交互量,又要保证高质量的抠图结果。为此,本文在如下一些方面进行了研究和探索。一、研究便捷的交互方式,使得用户从繁琐的三分图的制作过程中解脱出来:二、探索便捷的局部修改技术,使得用户可以方便地对抠图结果进行局部校正;三、研究便捷的视频抠图技术,从大尺度的视频数据中方便快速地提取出移动的前景α图(matte)和前景目标。更为重要的是,保持视频抠图的时空一致性。基于上述目标,本文的主要内容如下:第一章介绍图像和视频抠图的意义及抠图技术的演化和发展。对抠图的相关工作进行了阐述,并对其不足之处进行讨论。随后,揭示了图像和视频抠图的难点,引出本文的研究目标和文章组织。第二章提出了基于线条的便捷图像抠图系统。采用基于线条的便捷交互方式和迭代的能量最小化系统框架,提取出了高质量的前景α图和前景目标。并进一步提出局部便捷抠图技术,对全局便捷抠图结果进行局部精细。更为重要的是,由于存在狄立克莱边界条件,局部修改结果可以无缝地嵌入全局抠图中,不会产生视觉跳跃。第三章将便捷图像抠取算法扩展到视频抠图,提出了基于马尔可夫链的视频抠图算法。将视频序列分割成具有相互关系的视频帧对,构建三维的能量函数对帧对进行优化。用户只需在关键帧上指定少量的前景和背景线条,系统即可自动快速地提取出整段视频的前景α图。并保持了视频抠图的局部时空连贯性。第四章将视频体的时空编辑界面和基于线条的交互模式相结合,利用线条的体扩散算法以及自动的背景重建技术,提出了一种新的时空一致的视频抠图算法。三维能量最优化系统框架将抠图方程的零阶连续性和一阶连续性作为能量方程的先验知识,得到了全局最优解,重建出了时空连贯的前景α和前景颜色。最后,第五章对全文进行总结并展望将来的研究方向。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 概述
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.2.1 图像和视频抠图
  • 1.2.2 图像和视频的剪切和粘贴
  • 1.3 问题阐述
  • 1.4 本文结构
  • 第二章 基于线条的便捷图像抠图
  • 2.1 介绍
  • 2.2 相关工作
  • 2.3 能量方程
  • 2.3.1 数据项
  • 2.3.2 光滑项
  • 2.3.3 动态权重参数
  • 2.4 全局便捷抠图
  • 2.5 局部便捷抠图
  • 2.5.1 局部能量方程
  • 2.5.2 局部操作
  • 2.6 结果和讨论
  • 2.7 小结
  • 第三章 基于马尔可夫链的视频抠图
  • 3.1 介绍
  • 3.2 相关工作
  • 3.3 视频抠图系统框架
  • 3.4 视频抠图能量的构建
  • 3.5 实验结果
  • 3.6 小结
  • 第四章 交互式的时空视频抠图
  • 4.1 介绍
  • 4.2 相关工作
  • 4.3 交互式视频抠图系统框架
  • 4.3.1 交互式的体扩散
  • 4.3.2 背景估计
  • 4.3.3 迭代的前景α图提取
  • 4.3.4 时空一致的前景重建
  • 4.4 结果
  • 4.4.1 讨论
  • 4.5 小结
  • 第五章 结论和将来的工作
  • 5.1 总结
  • 5.2 将来的工作
  • 附录A 随机场、能量函数和高斯混合模型
  • A.1 介绍
  • A.2 随机场
  • A.2.1 马尔可夫随机场
  • A.2.2 条件随机场
  • A.3 能量函数
  • A.4 高斯混合模型
  • A.4.1 混合模型
  • A.4.2 高斯混合模型
  • 参考文献
  • 发表文章目录
  • 简历
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    图像和视频的便捷抠图技术研究
    下载Doc文档

    猜你喜欢