最大稳定极值区域在图像检索领域的应用研究

最大稳定极值区域在图像检索领域的应用研究

论文摘要

随着互联网的发展,图像、视频数据迅速膨胀,如何有效地检索所需要的数据信息已成为图像处理领域的一个研究热点。传统的基于文本的图像检索技术因其人工标注的耗时性以及检索匹配的误差已不能满足当前海量资源的检索需求。为了便于图像的检索和识别,基于内容的图像检索技术应运而生。基于内容的图像检索技术的关键在于图像特征的提取与描述。该文在比较多种仿射不变性区域的基础上,选取最大稳定极值区域对图像内容进行分割和提取。该文总结了最大稳定极值区域的定义、性质,然后归纳出一种高效实用的检测方法,使得特征提取时间复杂度接近线性。借鉴文本检索的思想,该文提出了基于目标区域的图像检索方法。首先从图像中提取最大稳定极值区域,并利用熵值过滤方法去除含信息量较少的冗余区域,然后通过SIFT描述子对区域进行向量表述;利用改进的K均值算法对特征向量进行聚类,由聚类中心构造视觉关键词表;进而把图像看成是由视觉关键词组成的文档,通过倒排文档的思想进行相似性度量实现基于全图的图像检索;通过对目标区域内视觉关键词的类属和词频进行统计,利用投票得分的方式实现基于目标区域的图像检索。为了去除误配以提高图像检索精度,该文还对视觉关键词之间的空间约束关系进行研究,利用视觉关键词的空间一致性对检索结果进行重排序,大大提高了检索的准确率。该文最后通过对图像检索技术进行推广,实现了基于最大稳定极值区域的视频拷贝检测:首先利用颜色直方图进行视频镜头分割并提取关键帧,然后利用最大稳定极值区域对关键帧进行匹配,最后通过时序投票方法检索定位视频片段的查询结果。该文建立了基于最大稳定极值区域的图像检索系统和视频拷贝检测系统,并利用TRECVID数据集进行测试。实验证明,最大稳定极值区域是一种性能优异的仿射不变性特征,以其作为底层特征的图像、视频检索系统能取得较高的查全率和查准率。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 论文的研究背景
  • 1.2 基于内容图像检索技术的国内外研究现状
  • 1.2.1 图像检索系统介绍
  • 1.2.2 关键技术和难点问题
  • 1.3 论文研究的意义和目的
  • 1.4 论文的主要内容及章节安排
  • 2 图像内容分析及仿射不变性特征提取
  • 2.1 颜色特征
  • 2.2 纹理特征
  • 2.3 形状特征
  • 2.4 仿射不变性特征
  • 2.4.1 仿射不变性区域检测子
  • 2.4.2 综合评价
  • 2.5 本章小结
  • 3 最大稳定极值区域仿射不变性检测子
  • 3.1 最大稳定极值区域
  • 3.1.1 定义
  • 3.1.2 性质
  • 3.2 最大稳定极值区域的提取算法
  • 3.2.1 像素点排序
  • 3.2.2 提取极值区域
  • 3.2.3 成分树及最大稳定判定条件
  • 3.2.4 区域清理
  • 3.2.5 不规则区域的椭圆调整
  • 3.3 实验效果
  • 3.4 本章小结
  • 4 基于最大稳定极值区域的图像检索技术
  • 4.1 SIFT描述子的生成
  • 4.1.1 特征主方向的确定
  • 4.1.2 局部图像特征块的向量描述
  • 4.2 图像检索的技术路线
  • 4.2.1 MSER特征提取及过滤
  • 4.2.2 视觉关键词生成
  • 4.2.3 图像的相似度度量
  • 4.2.4 视觉关键词的空间约束关系
  • 4.3 检索性能评价
  • 4.4 图像检索系统的实现
  • 4.4.1 运行平台及开发工具
  • 4.4.2 系统功能和实现
  • 4.4.3 实验效果
  • 4.5 本章小结
  • 5 基于最大稳定极值区域的视频拷贝检测技术
  • 5.1 拷贝检测任务概述
  • 5.2 基于MSER的视频拷贝检测技术路线
  • 5.2.1 视频镜头分割及关键帧提取
  • 5.2.2 MSER提取及描述
  • 5.2.3 关键帧匹配
  • 5.2.4 拷贝定位
  • 5.3 拷贝检测系统实现及效果
  • 5.3.1 实验设计
  • 5.3.2 实验效果
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    最大稳定极值区域在图像检索领域的应用研究
    下载Doc文档

    猜你喜欢