基于内容的视频片段检索的研究

基于内容的视频片段检索的研究

论文摘要

随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长,视频作为多媒体信息中最复杂一种媒体形式,凭借其多样化的表现形式、丰富的语义内容,以及便捷的记录方式得到了广泛的应用和发展。与此同时,大容量存储技术的发展,使得数字化视频信息存储的代价越来越低,进而促进了数字视频信息的大量产生和堆积。面对越来越多的海量视频库,如何快速有效地进行视频内容分析和检索就成为当前视频信息领域研究的当务之急。针对视频信息检索的需要,本文研究了视频检索中的两个关键技术:视频镜头边界检测及视频片段相似度的度量。在视频边界检测方面,本文主要研究了视频的镜头边界检测及分割。提出了一个多检测器协同工作的镜头边界检测框架,包括应用模糊逻辑理论设计切变边界检测和基于非邻帧差的双阈值渐变边界检测。实验结果表明该框架具有很好的检测效果。在视频片段相似度度量方面,提出了一种新的有效的视频片段的度量方法,方法采用滑动窗口分割相似片段,应用粗集论的等价关系定义了镜头相似类的概念,通过镜头的相似类计算出镜头一一对应关系,用来确定视频片段的相似程度。同时考虑了视频片段相似性的视觉因子、顺序因子和干扰因子的结合,来解决片段相似度的度量问题。实验表明该方法具有较好的效果与鲁棒性。本文最后对工作进行了总结,同时对基于内容的视频检索未来的发展方向提出了自己的见解。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 基于内容的视频检索简介
  • 1.3 国内外的发展动态
  • 1.4 论文结构及主要内容
  • 第二章 基于内容的视频检索概述及模糊逻辑基础
  • 2.1 引言
  • 2.2 镜头边界检测
  • 2.2.1 镜头边界检测简介
  • 2.2.2 镜头边界检测方法的研究进展及现状
  • 2.2.3 象素域中镜头边界检测方法
  • 2.2.4 压缩域中的镜头边界检测方法
  • 2.3 关键帧的提取
  • 2.3.1 关键帧基本概念
  • 2.3.2 关键帧的选取原则
  • 2.4 视频相似度度量
  • 2.4.1 图像特征相似度
  • 2.4.2 视频片段的相似度
  • 2.5 模糊逻辑基础
  • 2.5.1 模糊集合
  • 2.5.2 模糊推理
  • 第三章 镜头边界检测的研究
  • 3.1 引言
  • 3.2 镜头边界检测框架
  • 3.3 基于模糊逻辑的切变边界检测
  • 3.3.1 特征的选取
  • 3.3.2 切变边界检测
  • 3.4 非邻帧差的镜头渐变边界的检测
  • 3.5 实验
  • 3.5.1 实验数据
  • 3.5.2 实验结果
  • 3.5.3 实验性能比较
  • 3.6 本章小结
  • 第四章 视频片段相似性度量的研究
  • 4.1 引言
  • 4.2 镜头相似度度量
  • 4.3 视频片段相似度度量
  • 4.3.1 基于滑动镜头窗的视频片段的自动分割
  • 4.3.2 确认真正相似的视频片段
  • 4.3.3 视频片段的相似度度量因子
  • 4.4 实验
  • 4.4.1 性能比较
  • 4.5 本章小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间主要的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于内容的视频片段检索的研究
    下载Doc文档

    猜你喜欢