论文题目: 基于内容的视频运动对象分割技术研究
论文类型: 博士论文
论文专业: 通信与信息系统
作者: 包红强
导师: 张兆扬
关键词: 图象处理,视频对象分割,时空联合
文献来源: 上海大学
发表年度: 2005
论文摘要: 随着现代信息社会的不断发展,人们获得的多媒体信息日益增加。因此,对各种多媒信息的处理技术就变成了相关领域内学者的重要研究任务。在这些多媒体中,视觉信息因其形象、生动和直观的特点而更为人们所关注,但同时视觉信息巨大的数据量给传输、存储、处理带来了挑战。因此对视觉信息尤其是视频信息的各种处理技术研究就从来没有停止过。 为了更有效地存储、传输和使用视频数据,必须进行视频压缩。MPEG组织提出了第二代视频压缩标准MPEG-4。相比与第一压缩标准,MPEG-4最显著的特点之一就是提出了基于对象的编码方式。要实现基于对象的视频编码,首行要进行视频对象分割。视频对象分割是指在时空域上将视频分割为一些视频语义对象的组合,也就是将每一个视频帧分割为一些不同语义对象区域。同时为视频数据检索服务的MPEG-7标准则提出了对各种媒体对象进行统一和规范化的描述。而一些计算机视觉等也需要基于对象的各种功能。因此,基于对象的视频信息描述方式已成为多媒体信息处理技术中的一种巨大需求。 然而,由于视视对象分割是相当困难的问题,MPEG-4尽管引入了视频对象的概念,但它并没有指定从视频序列获取视频对象的具体方法。视频对象分割的困难性主要体现在两方面:(1)现实世界中视频场景极度复杂和多样,很难用一种方法进行统一的分割;(2)视频对象的定义是一种基于高级语义的描述,很难用低层次的视觉描述方式如边缘、颜色、运动等特征来描述,而目前的图象分析技术又远远不足以将高层次语义对象用机器语言来准确的定义和描述。 尽管困难重重,但由于广泛的应用前景,近几年对视频对象分割技术的研究就从来没有停止过。本论文研究了视频对象分割中的一些技术难点和重点,包括如何提高自动视频运动对象分割的准确性,如何对视频分割中的难点问题如遮挡等进行处理,以及如何在多种复杂运动情况下进行对象分割。研究目标既有单视频对象,又有多视频对象,重点对多视频对象分割进行了研究。具体地,本论文的主要工作和创新点包括: 针对视频对象分割准确性不高的问题,提出了一种基于区域多重选择的视频运动对象分割提取方法:首先利用一种有效的方法在空间域(帧内)进行区域划分,得到基于区域表示的空间图;然后利用改进的帧差法计算序列时间域(帧间)信息,对所有区域进行分类选择,区域内运动属性非常明显的确定为对象区域,非常不明显的为背景区域,而介于两者中间的区
论文目录:
摘要
ABSTRACT
第一章 绪论
1.1 引言
1.2 视频对象分割的基本概念
1.2.1 对象的定义
1.2.2 视频分割与图像分割
1.2.3 研究视频对象分割的意义
1.3 视频对象分割的现状与存在问题
1.3.1 研究现状
1.3.2 算法基本分类
1.3.3 复杂运动的视频对象提取问题
1.4 本论文的研究背景及主要内容
1.5 论文结构
1.6 本章小结
第二章 视频对象分割的基本理论
2.1 引言
2.2 数学形态学预处理及后处理技术
2.2.1 数学形态学基本概念
2.2.2 形态学图象处理
2.2 空间域分割技术
2.2.1 阈值法
2.2.2 聚类法
2.2.3 分水岭变换
2.3 时间域分割技术
2.3.1 变化检测
2.3.2 光流场法
2.3.3 运动矢量场估计
2.4 时空联合分割技术
2.4.1 基于时空象素聚类理论的分割方法
2.4.2 基于区域的分割方法
2.4.3 对象跟踪
2.5 分割结果的评价方法
2.6 本章小结
第三章 基于区域多重选择的视频对象分割提取方法
3.1 引言
3.2 当前帧的帧内图象区域划分
3.3 区域的初始分类
3.4 区域的二次分类
3.5 区域的后处理技术
3.6 实验结果
3.7 本章小结
第四章 基于背景重建技术的视频对象分割
4.1 引言
4.2 背景技术对遮挡的处理
4.2.1 对象分割的数学表达式
4.2.2 噪声特征参数估计
4.2.3 变化检测模板CDM的填充技术
4.2.4 背景重构技术
4.2.5 遮挡消除和视频对象提取
4.3 实验结果及分析
4.4 结论
第五章 基于时空标记场最大后验概率的多视频对象分割算法
5.1 引言
5.2 多运动对象的基本描述
5.2.1 多对象的分割标记
5.2.2 运动估计模型
5.2.3 对象的颜色特征
5.3 多对象分割的贝叶斯模型
5.3.1 MRF/GRF模型
5.3.2 最大后验概率表示
5.3.3 基本模型分析
5.3.4 部分遮挡处理
5.4 能量函数的优化执行
5.4.1 初始对象区域划分
5.4.2 参数估计
5.4.3 优化执行过程
5.5 实验结果
5.5.1 独立运动时的多视频对象分割
5.5.2 视频对象间发生遮挡时的分割
5.5.3 与COST211算法的比较
5.5.4 分割结果的客观评价
5.6 本章小结
第六章 基于时空曲线演化的多视频运动对象分割算法
6.1 引言
6.2 时空曲线基本模型描述
6.2.1 时空能量模型
6.2.2 时空曲线的Level-set表示
6.3 曲线的初始轮廓及对象的初始分割
6.4 对象间的遮挡处理
6.5 实验结果
6.5.1 独立运动时的多视频对象分割
6.5.2 视频对象发生拓扑形状变化时的分割
6.5.3 视频对象间发生遮挡时的分割
6.5.4 曲线演化法与帧差法分割结果比较
6.5.5 分割结果的客观评价
6.6 本章小结
第七章 结论及展望
7.1 论文工作的总结
7.2 视频对象分割技术的展望
参考文献
攻读博士学位论文期间发表的学术论文
致谢
发布时间: 2005-09-16
参考文献
- [1].交互式视频传输策略研究[D]. 罗彬.华中科技大学2005
- [2].视频工具中的数据传输与控制机制[D]. 刘朋.中国科学院研究生院(计算技术研究所)1999
- [3].视频会议系统与MPEG-4标准的研究[D]. 高鹏.中国科学院研究生院(计算技术研究所)1999
- [4].企业级视频会议的服务质量保证研究[D]. 邓剑锋.华南理工大学2014
- [5].视频会议系统中QOS研究[D]. 凌波.浙江大学2008
- [6].软件定义多媒体组播系统与传输策略研究[D]. 杨恩众.中国科学技术大学2017