基于马尔可夫能量聚类的视频对象提取算法的研究

基于马尔可夫能量聚类的视频对象提取算法的研究

论文摘要

视频图像作为远程医疗系统的重要信息,为实时远程医疗诊断和监护提供了重要依据。然而视频巨大的数据量,给其存储和实时传输带来了极大的困难,已阻碍了远程医疗技术发展,因此对视频图像处理与分析,以获取特征信息,将对远程医疗视频图像的存储、传输和检索发挥重要的作用。视频对象的分割与跟踪是当前计算机视觉中非常活跃的研究领域,其目的是将视频图像序列划分成若干的运动对象,并在时间上对这些运动对象进行跟踪,为以后的研究工作奠定基础,如基于对象的编码技术以及基于内容的视频检索等。然而视频对象的多样性和所处环境的复杂性,给视频对象分割和跟踪带来巨大困难,使其成为计算机视觉和图像处理领域有待解决的一个经典难题。虽然,视频对象分割与跟踪的研究取得了一些进展,但目前尚没有一种通用性的全自动分割与跟踪算法。因此,本论文着眼于特定算法的实用性,开展一些关键问题的探索研究,其研究内容包括两个方面:从视频序列中准确地分割出所感兴趣的视频对象;对视频序列中的视频对象进行跟踪。首先分析了标准模糊C均值(FCM,Fuzzy C-Means)聚类在空间约束条件下的不同算法。由于视频图像在空间上的相关性,利用这些相关性,对FCM聚类算法进行扩展,以获取更符合人的感知要求的分割结果。实验证明这些利用空间约束的分割方法改善了视频对象的分割性能。其次,对各种统计分割算法进行了深入研究,改进了基于均值场理论和马尔可夫场视频对象分割算法。该算法首先对视频序列的帧差图像进行简单的前景和背景划分,然后采用均值场理论(MFT,Mean Field Theory),建立马尔可夫随机场(MRF,Markov Random Field)模型,构造模型的相应约束能量函数。利用最大后验估计(MRF-MAP),求最小能量函数,获取标记场,提取视频对象。实验结果显示,该分割算法充分考虑了图像局部空域相关性,不仅能较好地分割出简单背景下的单个运动对象,而且能从复杂背景中提取多个运动对象。再次,结合马尔可夫随机场模型和模糊C均值聚类方法,提出了一种基于马尔可夫能量的聚类算法。该算法首先采用模糊聚类求取初始标记场,然后通过MRF计算每个位置的特征能量,对能量进行全局聚类得到新的分割标记场,基于新的分割标记场重新计算每个位置上的特征能量,再进行聚类分割,不断循环分割,最终获得优化分割结果。由于将MRF模型的空间约束施加给模糊聚类算法,从而增强了算法的抗噪声能力。实验结果表明本文提出的方法能获得比较好的视频对象的形状信息,并可精确提取不同视频对象。最后,提出一种简单易行的基于最小矩形框的视频对象跟踪算法。通过对前一帧所获得的运动变化区域,计算其最小约束框以及运行速度和方向,快速跟踪出下一帧运动对象的位置,缩小视频对象分割的计算量和复杂程度。实验结果表明这种方法可以非常好地实现视频对象跟踪,获得逼近视频对象的轮廓。综上所述,论文将马尔可夫随机场引入到模糊聚类中,提出基于马尔可夫能量的模糊聚类算法,并利用标准的MPEG-4序列图像作为研究对象,实验结果验证了该算法可以有效地降低噪声给对象分割所带来的影响,提高了视频对象的分割效果。由于对视频对象的实时跟踪,减少了视频对象分割的计算量和复杂程度,进一步保证了图像序列分割的准确性和实时性。虽然分割方法在通用性方面做了一些努力,但还有许多工作需要进行更深入的研究。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 研究背景及意义
  • 1.3 研究现状
  • 1.3.1 视频分割方法的分类
  • 1.3.2 视频对象跟踪方法的分类
  • 1.4 本文结构
  • 第2章 基于FCM 和MRF 的分割算法
  • 2.1 基于FCM 的分割算法
  • 2.1.1 数据集的划分
  • 2.1.2 模糊C 均值聚类算法
  • 2.1.3 FCM 算法的扩展
  • 2.1.4 算法性能比较
  • 2.2 基于MRF 的分割算法
  • 2.2.1 马尔可夫随机场
  • 2.2.2 均值场
  • 2.2.3 基于均值场理论和马尔可夫随机场的分割算法
  • 2.2.3.1 简单区分前背景
  • 2.2.3.2 系统能量函数的计算
  • 2.2.3.3 算法详细步骤
  • 2.2.4 实验结果及分析
  • 2.2.4.1 实验结果
  • 2.2.4.2 算法性能比较
  • 2.2.5 结论
  • 第3章 基于能量聚类的对象分割算法
  • 3.1 基于马尔可夫能量聚类的分割算法
  • 3.1.1 全局运动补偿与场景变化检测
  • 3.1.2 算法基本结构
  • 3.1.3 基于能量的聚类
  • 3.1.4 Canny 算子边缘检测及数学形态学
  • 3.1.4.1 Canny 算子边缘检测
  • 3.1.4.2 数学形态学
  • 3.2 实验结果与分析
  • 3.3 总结
  • 第4章 基于最小矩形框的对象跟踪算法
  • 4.1 视频对象跟踪目的
  • 4.2 背景差分法
  • 4.3 基于最小矩形框的视频对象跟踪算法
  • 4.4 总结
  • 第5章 总结与展望
  • 5.1 全文工作总结
  • 5.2 今后工作展望
  • 参考文献
  • 致谢
  • 附录 (攻读学位期间所发表的学术论文)
  • 相关论文文献

    • [1].算法:一种新的权力形态[J]. 治理现代化研究 2020(01)
    • [2].算法决策规制——以算法“解释权”为中心[J]. 现代法学 2020(01)
    • [3].面向宏观基本图的多模式交通路网分区算法[J]. 工业工程 2020(01)
    • [4].算法中的道德物化及问题反思[J]. 大连理工大学学报(社会科学版) 2020(01)
    • [5].算法解释请求权及其权利范畴研究[J]. 甘肃政法学院学报 2020(01)
    • [6].算法新闻的公共性建构研究——基于行动者网络理论的视角[J]. 人民论坛·学术前沿 2020(01)
    • [7].算法的法律性质:言论、商业秘密还是正当程序?[J]. 比较法研究 2020(02)
    • [8].关键词批评视野中的算法文化及其阈限性[J]. 学习与实践 2020(02)
    • [9].掌控还是被掌控——大数据时代有关算法分发的忧患与反思[J]. 新媒体研究 2020(04)
    • [10].美国算法治理政策与实施进路[J]. 环球法律评论 2020(03)
    • [11].算法解释权:科技与法律的双重视角[J]. 苏州大学学报(哲学社会科学版) 2020(02)
    • [12].大数据算法决策的问责与对策研究[J]. 现代情报 2020(06)
    • [13].大数据时代算法歧视的风险防控和法律规制[J]. 河南牧业经济学院学报 2020(02)
    • [14].风险防范下算法的监管路径研究[J]. 审计观察 2019(01)
    • [15].模糊的算法伦理水平——基于传媒业269名算法工程师的实证研究[J]. 新闻大学 2020(05)
    • [16].算法推荐新闻对用户的影响及对策[J]. 新媒体研究 2020(10)
    • [17].如何加强对算法的治理[J]. 国家治理 2020(27)
    • [18].“后真相”背后的算法权力及其公法规制路径[J]. 行政法学研究 2020(04)
    • [19].算法规制的谱系[J]. 中国法学 2020(03)
    • [20].论算法排他权:破除算法偏见的路径选择[J]. 政治与法律 2020(08)
    • [21].政务算法与公共价值:内涵、意义与问题[J]. 国家治理 2020(32)
    • [22].算法的法律规制研究[J]. 上海商业 2020(09)
    • [23].蚁群算法在文字识别中的应用研究[J]. 信息与电脑(理论版) 2019(22)
    • [24].大数据聚类算法研究[J]. 无线互联科技 2018(04)
    • [25].RSA算法的改进研究[J]. 计算机与网络 2018(14)
    • [26].智能时代的新内容革命[J]. 国际新闻界 2018(06)
    • [27].改进的负载均衡RSA算法[J]. 电脑知识与技术 2018(25)
    • [28].基于深度学习的视觉跟踪算法研究综述[J]. 计算机科学 2017(S1)
    • [29].大数据算法的歧视本质[J]. 自然辩证法研究 2017(05)
    • [30].深度学习算法在智能协作机器人方面的应用[J]. 中国新通信 2017(21)

    标签:;  ;  ;  ;  ;  

    基于马尔可夫能量聚类的视频对象提取算法的研究
    下载Doc文档

    猜你喜欢