基于视频内容分析的检索方法研究及实现

基于视频内容分析的检索方法研究及实现

论文摘要

数字化和互联网时代的到来,造成多媒体数据的海量增长。基于视频数据结构复杂、内容难以描述且数据量大的特点,如何有效地组织、管理和检索这些多媒体内容成为研究热点。在众多的视频类型中,新闻视频有其自身的特殊结构,且是基于内容的视频检索的一个热点对象。本文工作对基于内容的新闻视频检索进行多方面的研究,包括镜头分割、视频故事分割和基于图像和视频标题文字的检索。为满足系统结构化要求,采用模块化设计,将内容分析、检索过程分成视频内容索引生成、查询文件特征提取和特征匹配三个模块,对于索引文件使用了ProtocolBuffer数据处理组件,最终实现了一个通用的基于B/S架构的新闻视频检索系统,功能包括文本检索和内容检索,视频摘要浏览,多媒体数据管理等。本文的主要工作为以下六个方面。1.学习了解现今多媒体检索技术的成果,包括各种多媒体检索系统和内容分析关键技术,特别是视频内容分析技术。2.检测视频镜头转换边界:分析了基于像素灰度差的镜头边界检测算法,针对其对物体或相机运动较为敏感、还有易受闪光灯影响等缺陷,本文提出了一种结合全局阈值和局部自适应阈值的像素灰度差的镜头检测算法,该算法经实验证明具有良好的效果,且不受闪光灯影响,准确率和查全率均达到了95%以上。3.通过对新闻视频主持人和新闻标题出现的规律的统计分析,实现新闻视频故事切分算法:学习并实现了基于模板的新闻视频主持人镜头检测算法,对于标题条,本文提出了一种基于标题条边缘信息的概率Hough变换的检测算法,然后通过对主持人镜头和新闻标题的出现规则达到新闻视频故事分割,实验结果表明故事分割准确率达到98%,查全率达到99%。4.通过投影算法提取出标题区域并用OCR进行识别,将识别出的新闻标题字幕作为索引信息之一放入数据库,方便用户检索。实验结果表明了算法具有比较满意的标题定位准确率,OCR识别结果还可以再提高。5.提取视频关键帧的图像特征,对关键帧提取HSV空间颜色直方图、累加直方图、局部累加直方图三种直方图特征和纹理特征,实现图像检索功能,实验结果表明基于直方图的前20个候选检索率达到85%以上。6.将上述内容分析和检索方法以模块化设计成三个模块嵌入系统内,并使用Protocol Buffer数据处理组件建立索引文件,实现基于Web的新闻检索系统。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.3 论文主要工作
  • 1.4 章节安排
  • 第二章 视频内容分析方法研究
  • 2.1 视频数据的特点
  • 2.1.1 视频数据结构
  • 2.1.2 新闻视频数据结构
  • 2.2 视频特征
  • 2.3 镜头边界检测
  • 2.3.1 镜头边界检测方法的研究进展和现状
  • 2.3.2 基于双阈值的镜头检测方法
  • 2.3.3 实验结果
  • 2.4 关键帧提取技术
  • 2.4.1 关键帧概念
  • 2.4.2 关键帧提取方法
  • 2.5 本章小结
  • 第三章 基于故事分割的新闻视频结构特征分析
  • 3.1 主持人检测
  • 3.1.1 基于模板的主持人检测
  • 3.1.2 实验结果
  • 3.2 新闻视频标题条识别
  • 3.2.1 标题检测和识别
  • 3.2.2 实验结果
  • 3.3 新闻故事分割实验及结果
  • 3.4 本章小结
  • 第四章 基于内容的视频检索系统
  • 4.1 基于图像检索视频
  • 4.1.1 图像直方图特征检索
  • 4.1.2 图像纹理特征检索
  • 4.1.3 图像检索结果
  • 4.2 基于标题文字检索视频
  • 4.3 新闻视频检索系统结构和性能测试
  • 4.3.1 基于Protocol Buffer 的视频索引模块
  • 4.3.2 视频检索模块
  • 4.3.3 系统展示和性能测试
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 作者在读期间的研究成果
  • 致谢
  • 附件
  • 相关论文文献

    标签:;  ;  ;  

    基于视频内容分析的检索方法研究及实现
    下载Doc文档

    猜你喜欢