视频对象自动分割技术及其细胞神经网络实现方法的研究

视频对象自动分割技术及其细胞神经网络实现方法的研究

论文题目: 视频对象自动分割技术及其细胞神经网络实现方法的研究

论文类型: 博士论文

论文专业: 通信与信息系统

作者: 张庆利

导师: 张兆扬,莫玉龙

关键词: 视频对象分割,时空联合,数学形态学,细胞神经网络,光流,分水岭

文献来源: 上海大学

发表年度: 2005

论文摘要: 传统的视频压缩编码标准MPEG1/2和H.26x都采用基于帧的技术,不要求对场景进行分割。它们能获得较高的压缩比,并在许多领域得到了广泛的应用。随着多媒体信息的日益丰富,人们不再满足于对视频信息的简单浏览,而要求提供基于对象的操纵、交互等功能。 为此,MPEG组织提出了第二代视频压缩标准MPEG-4,MPEG-4最显著的特征之一就是基于对象的编码方式。要实现基于对象的视频编码,首先要进行视频对象分割。视频对象分割是指在时空域上将视频分割为一些视频语义对象的集合,也就是将每一个视频帧分割为一些不同语义对象区域。事实上,视频对象分割技术不仅仅可以为MPEG-4服务,在许多计算机视觉领域都能发挥视频对象分割技术的作用。视频对象分割技术有很广阔的应用前景,其中的一些典型例子包括视频编码、视频制作和编辑、视频检索、视频监控等。 视频对象分割是计算机视觉领域中的一个难点,这主要是由于现实世界中场景的复杂性和多样性,很难建立一个统一的先验模型,这就决定了很难找到一种单一的方法来完成这项任务。研究通用视频对象分割方法的困难还来自于对“语义对象”的定义:视频对象的分割不仅仅是低层次的视觉分割,还涉及到高层次的语义定义和特征提取。所以,尽管视频对象分割算法的研究得到了广泛的重视,并且已经提出了众多的算法,但是,视频对象分割算法与MPEG-4标准的要求相比还远未成熟。概括起来,目前的视频对象算法主要存在以下一些问题:首先,目前还不存在一种适合于所有序列的通用算法;其次,由于分割过程中计算量大,尚难满足实时性要求。 本论文重点研究MPEG-4框架下从视频序列中分割出视频对象的方法和技术,针对目前的视频分割算法大多数难以满足实时性要求的缺点,引入细胞神经网络来解决。 论文主要工作包括以下几个方面: 1) 提出了一种基于边缘投影的头肩序列人脸提取算法。通过对头肩序列进行分析,可知面部的运动细节比较丰富,也比较集中。因此可以通过对帧间差分图像做水平和垂直投影,确定人脸的大致坐标,搜寻范围变为一个矩形小区域。之后对这小块区域使用游程编码进行区域划分,结合前面得到的帧差运动信息,提取出人脸区域。这种算法综合利用了空间灰度信息和运动信息,因而能够比较准确地分割出人脸。 2) 提出了两种头肩序列中视频对象的分割算法。其中一种是时空结合的视

论文目录:

摘要

Abstract

第一章 绪论

1.1 引言

1.2 问题背景

1.3 视频对象分割综述

1.3.1 视频对象分割的相关概念

1.3.2 视频分割与图像分割的关系

1.3.3 视频对象的表示

1.3.4 视频分割技术的应用

1.3.5 视频分割算法的分类

1.4 发展趋势及存在问题

1.4.1 发展趋势

1.4.2 存在问题

1.5 细胞神经网络的引入

1.6 论文的主要内容与结构

1.7 本章小结

第二章 视频分割基础

2.1 图像分割

2.1.1 灰度阈值法分割

2.1.2 特征空间聚类

2.1.3 连通区域标记

2.1.4 视频对象分割技术的评价

2.2 运动估计

2.2.1 Horn-Schunck光流法

2.2.2 块匹配法

2.3 对象跟踪

2.3.1 活动轮廓模型(Snake)

2.3.2 豪斯道夫对象跟踪器(Hausdorff)

2.4 数学形态学

2.4.1 二值图像的数学形态学运算

2.4.2 灰度图像的数学形态学运算

2.5 本章小节

第三章 头肩序列的分割算法

3.1 引言

3.2 头肩视频序列分析

3.3 基于时空信息的头肩序列分割算法

3.3.1 帧间差分

3.3.2 灰度区域划分

3.3.3 分割掩模与实验结果

3.3.4 结果分析

3.4 基于运动投影的人脸提取算法

3.4.1 头像区域确定

3.4.2 游程编码

3.4.3 实验结果及分析

3.5 基于梯度最大淹没区域的头肩序列快速分割算法

3.5.1 梯度淹没和最大区域提取

3.5.2 聚类

3.5.3 实验结果及分析

3.6 小结

第四章 基于光流和改进分水岭的视频对象分割方法

4.1 引言

4.2 算法详述

4.2.1 运动补偿和帧间差分

4.2.2 预处理

4.2.3 改进的分水岭算法

4.2.4 改进的Horn-Schunck光流法求光流模板

4.2.5 模板合并

4.3 实验结果与分析

4.4 小结

第五章 细胞神经网络分析及其用于分割算法的实现

5.1 引言

5.2 CNN的基本模型

5.3 CNN网络特性分析

5.3.1 CNN的有界性

5.3.2 CNN的稳定性分析

5.4 CNN的输入输出量化及用于图像处理的基本思想

5.4.1 CNN输入与输出量化

5.4.2 CNN用于图像处理的基本思想

5.5 CNN网络权的设计

5.6 人脸提取算法的CNN实现

5.6.1 由CNN实现算法概述

5.6.2 模板结构

5.6.3 实验结果与分析

5.7 基于光流和改进分水岭分割算法的CNN实现

5.7.1 经CNN实现算法的流程图

5.7.2 模板设计

5.7.3 实验结果与分析

5.8 本章小结

第六章 结论与展望

6.1 论文工作总结

6.2 展望

参考文献

攻读博士学位期间发表的论文

致谢

发布时间: 2005-09-16

参考文献

  • [1].基于内容多媒体应用的语义视频对象提取及评价[D]. 杨高波.上海大学2004
  • [2].视频语义信息提取关键技术研究[D]. 于跃龙.国防科学技术大学2005
  • [3].基于视觉真实的视频对象压缩[D]. 姚孝明.西南交通大学2006
  • [4].数字视频压缩理论与技术研究[D]. 赵海武.南京理工大学2002
  • [5].面向MPEG-4的视频分割算法研究[D]. 刘新春.中国科学院电子学研究所2000
  • [6].无线通信中视频编码及传输关键技术研究[D]. 张永健.北京邮电大学2015
  • [7].面向公安业务的视频结构化描述研究与实现[D]. 汤志伟.上海大学2015

相关论文

  • [1].面向对象生成的视频分割技术研究[D]. 朱辉.电子科技大学2003
  • [2].面向MPEG-4的视频分割和视频编码算法[D]. 夏金祥.电子科技大学2004
  • [3].数字视频运动分析、对象分割与压缩传输应用技术研究[D]. 石荣.电子科技大学2004
  • [4].细胞神经网络的非线性动力学机制及应用研究[D]. 周冬明.复旦大学2004
  • [5].视频语义信息提取关键技术研究[D]. 于跃龙.国防科学技术大学2005
  • [6].基于视频的目标检测与跟踪技术研究[D]. 王长军.浙江大学2006

标签:;  ;  ;  ;  ;  ;  

视频对象自动分割技术及其细胞神经网络实现方法的研究
下载Doc文档

猜你喜欢