视频语义信息提取关键技术研究

论文题目: 视频语义信息提取关键技术研究

论文类型: 博士论文

论文专业: 信息与通信工程

作者: 于跃龙

导师: 陈辉煌,卢焕章

关键词: 语义视频对象,语义视频对象平面,视频语义信息,统计变化检测,分割和跟踪,特征描述符

文献来源: 国防科学技术大学

发表年度: 2005

论文摘要: 视频语义信息是指描述视频中的物体形状、物体之间空间关系以及物体的事件等内容的信息。从视频中提取语义信息并用其对视频流进行描述,可以大大提高视频压缩比,增强对视频内容的访问、检索和操作功能,已成为国际学术界研究的热点。本文着重研究视频语义信息提取的关键技术问题,具体包括三个方面的内容。在语义视频对象平面的自动分割方面,重点研究了统计变化检测技术。首先提出了一种统计变化检测和时空滤波器相结合的分割算法,可以很好地处理对象的慢速运动,并能有效消除因对象运动而暴露的背景区域的影响。接着研究了基于背景图像的分割算法,提出了利用多个帧间变化检测结果进行累积判决构造背景图像的技术,该技术不受对象慢速运动的影响。最后,提出了利用多个连续帧差,在时域窗内进行统计分析以分割头肩视频序列的算法,算法的分割结果较为准确,计算复杂度低。研究了语义视频对象的分级跟踪技术。为了满足不同应用对视频对象跟踪处理在速度和准确性方面的不同需求,设计了一种分级跟踪处理框架,由高级图像分析、低级图像分析两个层次构成。在高级图像分析中,根据视频对象的总体特征(定界框、面积、中心坐标等),实现对象运动轨迹的跟踪。在低级图像分析中,利用颜色、边缘、纹理等特征,采用模糊C-均值聚类算法进行区域分割,利用区域特征描述符的映射作为下一帧分割的预测,得到具有精确边界和准确帧间对应关系的区域。通过高级图像分析和低级图像分析的交互,利用对象所包含的区域的边界和帧间对应关系,进一步提高语义视频对象的时域一致性和空域准确性。研究了视频语义信息的层次化描述和提取技术。提出了一种视频语义信息层次化表示模型,模型在镜头、视频对象、视频对象平面、视频对象区域等几个层次上层组织不同细节级别的视频语义信息,将视频的低级视觉信息与高级语义信息结合起来。设计了一种视频语义信息的结构化描述方案,用对象层次来描述不同层次的对象之间的关系,通过实体关系图来描述同一层次不同对象之间的关系,实现了对视频语义信息的多级概括。利用以上模型设计了一种视频数据库查询系统,用户可以根据不同的层次特征,对视频数据库进行有效地浏览和检索。

论文目录:

摘要

ABSTRACT

第一章绪论

1．1 课题的背景

1．2 研究现状

1．2．1 语义视频对象平面的分割技术

1．2．2 语义视频对象的跟踪技术

1．2．3 视频语义信息提取和描述技术

1．3 论文的主要工作

1．4 论文内容安排

第二章区域分割和变化检测技术

2．1 区域分割技术

2．1．1 特征空间

2．1．2 聚类策略

2．1．3 距离测度

2．2 变化检测技术

2．2．1 变化检测的特征选取

2．2．2 变化检测的特征分析

2．2．3 变化检测的分类步骤

2．2．4 变化检测的后处理

2．3 小结

第三章语义视频对象平面的自动分割技术

3．1 引言

3．2 基于假设检验的统计变化检测技术

3．2．1 基于假设检验的统计变化检测技术

3．2．2 实验结果及分析

3．3 统计变化检测和时空滤波器相结合的语义视频对象平面分割算法

3．3．1 统计变化检测和时空滤波器相结合的分割算法流程

3．3．2 统计变化检测和时空滤波器相结合的分割算法实现

3．3．3 实验结果及分析

3．4 基于背景帧的语义视频对象平面分割算法

3．4．1 背景帧的构造技术

3．4．2 阴影消除技术

3．4．3 实验结果及分析

3．5 基于时域统计变化检测的头肩视频序列分割算法

3．5．1 分割算法结构框图

3．5．2 头肩视频序列的分割

3．5．3 实验结果及分析

3．6 小结

第四章语义视频对象的分级跟踪技术

4．1 引言

4．2 语义视频对象的分级跟踪处理框架

4．2．1 语义视频对象的跟踪处理要求

4．2．2 语义视频对象的分级跟踪处理框架

4．3 基于语义视频对象平面特征描述符的实时跟踪算法

4．3．1 基于语义视频对象平面特征描述符的实时跟踪算法结构流程

4．3．2 基于语义视频对象平面特征描述符的实时跟踪算法的实现

4．3．3 算法分析

4．4 融合多特征的区域分割和跟踪算法

4．4．1 融合多特征的区域分割算法

4．4．2 基于区域特征描述符的区域跟踪算法

4．5 对象划分和区域划分之间的交互

4．5．1 对象划分表示

4．5．2 区域划分表示

4．5．3 对象划分和区域划分之间的交互

4．6 实验结果及分析

4．7 小结

第五章视频语义信息的层次化提取与描述技术

5．1 引言

5．2 视频语义信息层次化表示模型

5．2．1 基于镜头的模型

5．2．2 基于对象的模型

5．2．3 视频语义信息层次化表示模型

5．3 基于层次化表示模型的视频语义信息提取

5．3．2 视频镜头的检测

5．3．3 全局特征提取

5．3．4 视频分析

5．3．5 视频解释

5．4 视频语义信息的结构化描述

5．4．1 多媒体内容描述接口MPEG-7

5．4．2 视频语义信息的结构化描述

5．5 视频语义信息的应用

5．5．1 基于对象的视频编码

5．5．2 高级智能监控

5．5．3 视频操作(Video manipulation)

5．5．4 视频数据库查询系统

5．6 小结

第六章结束语

致谢

参考文献

攻读博士期间已撰写和发表的论文

发布时间: 2005-11-07

参考文献

[1].基于内容多媒体应用的语义视频对象提取及评价[D]. 杨高波.上海大学2004
[2].视频对象自动分割技术及其细胞神经网络实现方法的研究[D]. 张庆利.上海大学2005
[3].基于视觉真实的视频对象压缩[D]. 姚孝明.西南交通大学2006
[4].数字视频压缩理论与技术研究[D]. 赵海武.南京理工大学2002
[5].面向MPEG-4的视频分割算法研究[D]. 刘新春.中国科学院电子学研究所2000
[6].无线通信中视频编码及传输关键技术研究[D]. 张永健.北京邮电大学2015
[7].面向公安业务的视频结构化描述研究与实现[D]. 汤志伟.上海大学2015

视频语义信息提取关键技术研究

猜你喜欢