论文摘要
随着互联网的发展,图像、视频数据迅速膨胀,如何有效地检索所需要的数据信息已成为图像处理领域的一个研究热点。传统的基于文本的图像检索技术因其人工标注的耗时性以及检索匹配的误差已不能满足当前海量资源的检索需求。为了便于图像的检索和识别,基于内容的图像检索技术应运而生。基于内容的图像检索技术的关键在于图像特征的提取与描述。该文在比较多种仿射不变性区域的基础上,选取最大稳定极值区域对图像内容进行分割和提取。该文总结了最大稳定极值区域的定义、性质,然后归纳出一种高效实用的检测方法,使得特征提取时间复杂度接近线性。借鉴文本检索的思想,该文提出了基于目标区域的图像检索方法。首先从图像中提取最大稳定极值区域,并利用熵值过滤方法去除含信息量较少的冗余区域,然后通过SIFT描述子对区域进行向量表述;利用改进的K均值算法对特征向量进行聚类,由聚类中心构造视觉关键词表;进而把图像看成是由视觉关键词组成的文档,通过倒排文档的思想进行相似性度量实现基于全图的图像检索;通过对目标区域内视觉关键词的类属和词频进行统计,利用投票得分的方式实现基于目标区域的图像检索。为了去除误配以提高图像检索精度,该文还对视觉关键词之间的空间约束关系进行研究,利用视觉关键词的空间一致性对检索结果进行重排序,大大提高了检索的准确率。该文最后通过对图像检索技术进行推广,实现了基于最大稳定极值区域的视频拷贝检测:首先利用颜色直方图进行视频镜头分割并提取关键帧,然后利用最大稳定极值区域对关键帧进行匹配,最后通过时序投票方法检索定位视频片段的查询结果。该文建立了基于最大稳定极值区域的图像检索系统和视频拷贝检测系统,并利用TRECVID数据集进行测试。实验证明,最大稳定极值区域是一种性能优异的仿射不变性特征,以其作为底层特征的图像、视频检索系统能取得较高的查全率和查准率。
论文目录
相关论文文献
标签:仿射不变性区域论文; 最大稳定极值区域论文; 视觉关键词论文; 图像检索论文; 拷贝检测论文;