视频对象分割算法研究

视频对象分割算法研究

论文摘要

视频对象分割是MPEG-4基于内容的编码系统中的关键技术之一,此外,它在基于内容的检索、对象识别、对象跟踪、视频电话、视频购物、视频监控、电视特技制作和交互式操作的多媒体中也有重要的应用。不仅如此,许多机器视觉问题都要借助视频对象分割技术才能完成。因此,视频对象分割技术具有重要的研究意义和应用价值,它是当前多媒体技术研究中的热点和难点之一。本论文正是针对上述问题,对视频对象分割算法问题作了创新性和探索性研究。主要内容为:1.首先分析和研究了视频对象分割所涉及的主要理论和方法。主要分析了模糊聚类理论和模糊C均值聚类方法,概率统计学中的贝叶斯(Bayes)分类器、最大后验概率模型和马尔可夫(Markov)随机场模型,形态学的膨胀、腐蚀以及开闭运算方面的理论和方法,神经网络方面的神经元模型、神经网络分类器和BP训练算法,全局运动估计中的六参数仿射运动模型、Gauss-Newton迭代法和Levenberg-Marquardet优化方法。2.在视频对象分割中,为了得到准确的视频对象轮廓,常用视频对象的边缘对所得到的对象轮廓进行校正。因此图像边缘提取对于视频对象分割非常重要。初步分析了克隆技术,建议了一种克隆算法,将它用于彩色图像边缘检测,建立了一种边缘检测模型,并联合使用边缘连接算法给出一种彩色图像边缘提取的新方法。在图像边缘提取中,阈值的选取是关键技术之一,分析了人类视觉系统特性,建立了视觉系统的数学模型,给出一种边缘检测中基于人类视觉特性的自动阈值选取方法。论文提出的边缘检测方法同其他算法相比,能得到更连续的边缘和更少的过检测点。3.分析和研究了基于时间信息或空间信息的自动视频对象分割算法的特点和优缺点,针对这两种类型的算法都不能充分地利用视频序列时间和空间信息的问题,提出一种有效的时空联合分割算法。首先输入一组视频序列帧,选择第一帧作为参考帧,求出其它各帧同参考帧的帧差,将得到的一组帧差求最大值获得初始帧差图像,利用模糊C均值聚类算法和遗传优化方法对帧差图像进行聚类分析,得到初始帧差模板。利用分层的块匹配算法进行运动矢量估计,由运动矢量获得初始运动模板,然后对帧差和运动模板求或,得到粗糙的视频对象模板。由于模板中存在许多空洞和噪声点,对模板进行填充和去噪。基于模板和运动窗技术获得对象的运动窗口,在运动窗内利用边缘提取算法获得视频对象的边缘,基于对象边缘对模板进行轮廓校正。用原始视频数据对校正后的模板赋值,得到初始视频对象。最后通过运动估计和背景注册信息完成视频对象的跟踪。仿真结果同其它相关算法的结果进行了比较,证明算法可以获得满意的分割和跟踪效果。4.研究了帧差分割算法存在的问题和背景差分割算法的优点。提出一种基于背景构建的自动视频对象分割算法。首先对多帧视频片段作统计性分析,基于帧差和运动信息提取多组关键帧,基于这些关键帧获得各组的关键背景,利用这些关键背景和背景预测方法得到视频序列的全景图像。输入视频序列帧,求出各帧同全景图像的背景差图像,利用BP神经网络分类器对背景差图像进行分类,通过分类得到各帧的对象模板,利用模板填充、局部噪声去除和局部平滑算法对模板进行后续处理,最后利用各帧的原始图像数据对模板赋值,提取出各帧视频对象。对于具有动态背景的视频序列,利用全局运动估计和补偿技术对摄像机的运动进行补偿,对补偿后的视频序列基于求多帧中值的方法得到每帧的背景。利用背景差算法进行视频对象的分割和跟踪。仿真结果和其它相关算法的分割结果进行了主客观两方面的比较,验证了本章算法的有效性。5.研究和分析了一些典型的半自动视频对象分割方法,这些算法中大部分需要过多的人工参与,大大降低了算法的速度和可操作性,不利于算法的有效执行。针对这种情况,提出一种联合背景构建和运动估计技术的半自动视频对象分割算法。首先在GUI中通过鼠标描绘出视频对象的大致边界,基于对象的边缘信息对轮廓进行校正,然后利用轮廓填充和平滑算法得到初始帧对象模板。基于模板得到初始帧视频对象和初始背景。利用背景差算法得到后续帧对象模板,利用运动估计对模板进行校正,根据相邻帧的对象模板对背景更新,最后通过背景的不断更新和背景差算法完成后续帧对象跟踪。仿真结果和其它相关算法的分割结果进行了主客观两方面的比较,验证了本章算法的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 研究现状
  • 1.3 论文的主要研究工作
  • 1.4 论文的总体结构
  • 第二章 视频对象分割所涉及的主要理论和方法
  • 2.1 模式聚类的理论基础
  • 2.1.1 特征选择和提取
  • 2.1.2 相似性度量
  • 2.1.3 聚类决策
  • 2.2 模糊聚类
  • 2.3 统计模式识别方面的有关理论
  • 2.3.1 贝叶斯(Bayes)分类器
  • 2.3.2 马尔可夫(Markov)随机场模型
  • 2.4 神经网络方面的有关理论
  • 2.4.1 神经元模型
  • 2.4.2 神经网络分类器
  • 2.4.3 神经网络的BP学习算法
  • 2.5 形态学方面的有关理论
  • 2.5.1 膨胀和腐蚀
  • 2.5.2 开和闭
  • 2.6 全局运动估计和补偿
  • 2.7 本章小结
  • 第三章 用于视频对象分割的图像边缘检测
  • 3.1 引言
  • 3.2 克隆技术及克隆算法
  • 3.2.1 克隆技术
  • 3.2.2 克隆算法
  • 3.3 克隆算法和边缘连接算法的数学模型及应用
  • 3.3.1 克隆算法的数学模型
  • 3.3.2 图像边缘检测中基于人类视觉特性的阀值选取
  • 3.3.3 边缘连接算法的数学模型
  • 3.3.4 克隆算法和边缘连接算法在彩色图像边缘检测中的应用
  • 3.4 边缘检测的快速算法
  • 3.5 试验结果和比较
  • 3.6 本章小结
  • 第四章 基于时空联合的视频对象分割
  • 4.1 基于空间信息的视频对象分割
  • 4.2 基于时间信息的视频对象分割
  • 4.3 基于时空信息的视频对象分割
  • 4.3.1 算法概述
  • 4.3.2 初始视频对象模板提取
  • 4.3.3 视频对象跟踪
  • 4.5 试验结果和比较
  • 4.6 本章小结
  • 第五章 基于背景构建的自动视频对象分割
  • 5.1 引言
  • 5.2 静止背景构成和帧差法分析
  • 5.3 背景差法分析
  • 5.4 背景构建
  • 5.4.1 参考帧对象模板获得
  • 5.4.2 关键背景和全景图像获得
  • 5.4.3 动态背景构建
  • 5.5 基于背景差法的视频对象提取
  • 5.5.1 背景差图像获得
  • 5.5.2 基于BP神经网络的对象模板获得
  • 5.6 试验结果和比较
  • 5.7 本章小结
  • 第六章 半自动视频对象分割
  • 6.1 引言
  • 6.2 初始帧视频对象提取
  • 6.3 后续帧视频对象跟踪
  • 6.3.1 背景构建
  • 6.3.2 背景差模板提取
  • 6.3.3 运动估计和模板校正
  • 6.4 试验结果和比较
  • 6.5 本章小结
  • 第七章 全文总结
  • 致谢
  • 参考文献
  • 攻博期间取得的研究成果
  • 个人简历
  • 相关论文文献

    • [1].基于主动学习的视频对象提取方法[J]. 吉林大学学报(工学版) 2013(S1)
    • [2].基于视频对象的区域分割及其应用[J]. 计算机工程 2009(06)
    • [3].视频对象分类特征评价与选择方法[J]. 小型微型计算机系统 2009(10)
    • [4].基于MPEG-4的视频对象跟踪算法[J]. 青岛理工大学学报 2008(02)
    • [5].一种时域和梯度域相结合的视频对象提取算法[J]. 中国图象图形学报 2008(03)
    • [6].基于内容的多层次语义视频对象提取方法研究[J]. 信息技术 2008(09)
    • [7].结合运动与边缘信息的语义视频对象提取方法[J]. 电子技术与软件工程 2020(07)
    • [8].增强现实中的视频对象跟踪算法[J]. 计算机工程 2010(12)
    • [9].基于高频分量差异度的视频对象移除篡改检测算法[J]. 数据通信 2017(01)
    • [10].运动视频对象的时空联合检测技术[J]. 光电子.激光 2009(07)
    • [11].以文件的形式收藏在线视频[J]. 网友世界 2010(23)
    • [12].一个可定位视频对象的地理空间表达框架[J]. 地球信息科学学报 2015(09)
    • [13].基于内容的MPEG_4视频对象提取技术研究[J]. 兰州工业高等专科学校学报 2011(05)
    • [14].MPEG-4标准及其应用[J]. 电脑知识与技术 2009(09)
    • [15].如何在PowerPoint课件中插入视频对象[J]. 中国教育技术装备 2008(09)
    • [16].基于多帧间的差的视频对象提取方法及其在DSP上的实现[J]. 吉林大学学报(工学版) 2008(01)
    • [17].基于运动估计的Kalman滤波视频对象跟踪[J]. 计算机应用 2008(08)
    • [18].采样技术在基于DSP的视频对象提取中的应用[J]. 吉林大学学报(工学版) 2013(S1)
    • [19].视频对象移除篡改的时空域定位被动取证[J]. 通信学报 2020(07)
    • [20].基于模糊聚类的视频对象分割[J]. 微电子学与计算机 2008(07)
    • [21].2008年6~8月新修订IEC家用和类似用途电器标准一览[J]. 电器 2008(10)
    • [22].基于时空信息的自动视频对象分割算法[J]. 光电子.激光 2008(03)
    • [23].基于RTP和MPEG-4的流媒体系统的设计与实现[J]. 内江科技 2008(01)
    • [24].3G初期用户和谁视频[J]. 通信世界 2008(15)
    • [25].基于运动轨迹的视频检索方法[J]. 计算机工程与设计 2008(07)
    • [26].基于帧差特征点的视频对象提取跟踪的研究[J]. 计算机工程与设计 2009(24)
    • [27].视频对象形状错误隐藏技术研究[J]. 现代电子技术 2008(16)
    • [28].一种改进时空域联合的视频对象分割算法[J]. 重庆邮电大学学报(自然科学版) 2010(05)
    • [29].浅谈MPEG-4视频编码关键技术[J]. 硅谷 2009(14)
    • [30].基于区域生长和全局运动估计的视频对象提取[J]. 信息与电脑(理论版) 2009(18)

    标签:;  ;  ;  ;  ;  ;  ;  

    视频对象分割算法研究
    下载Doc文档

    猜你喜欢