基于局部特征的视觉上下文分析及其应用

基于局部特征的视觉上下文分析及其应用

论文摘要

近十几年来,随着计算机技术和多媒体技术的迅猛发展、数码产品的普及以及因特网应用的深入人心,网络上的多媒体数据呈现出爆炸式的增长。面对因特网上的海量多媒体数据,特别是图像数据,如何对其进行有效分析、快速检索、合理组织,是一项非常重要同时也是非常有挑战性的工作。视觉上下文分析研究图像和特征的内在的联系,是解决这一问题的有效手段。最近,随着局部视觉特征的提出,在计算机视觉和多媒体领域,越来越多的研究者开始关注基于局部特征的视觉上下文分析的研究。目前,基于局部特征的视觉上下文处理方法虽然取得了一定进展,然而由于低层特征和高层语义概念之间语义鸿沟的存在,视觉上下文分析还有很多问题需要研究。本论文对基于局部特征的视觉上下文进行了深入研究,根据具体场景,探索不同的上下文关系,分别应用用于图像重排序、典型图像挑选、部分拷贝图像检索、自动车牌检测。本论文的主要工作和创新之处归纳为以下几点:(1)论文提出了一种隐视觉上下文学习方法,基于文本检索返回的图像结果,针对其不相关性和冗余性问题,进行图像重排序和典型图像挑选。在隐视觉上下文学习模型中,论文一方面发掘图像和视觉单词间的隐语义关系,另一方面分别构建视觉单词和图像的链接图。通过利用图分析的方法,发掘视觉单词和图像的重要性。基于图像的重要性,可以进一步和基于文本检索的图像排序结果相融合,进行图像重排序。此外,在隐视觉上下文学习结果的基础上,论文提出了一种加权集覆盖方法,用于挑选出代表性的典型图像。(2)论文提出了一组基于局部视觉特征几何上下文的编码方法,包括空间编码、环编码和几何编码,用于大规模的部分拷贝图像检索中的快速几何校验,极大的提高了检索精度。由于传统的单纯基于局部特征量化方法往往引入许多几何不一致的匹配,影响图像间的相似度比较,降低检索精度。本论文基于经典的局部特征SIFT(Lowe,2004),提出了一组编码方法对图像中视觉单词间的相对几何位置关系进行简洁有效表达。该编码表达可实现平移不变、尺度不变、或(和)旋转不变。基于几何上下文编码表达,论文提出了一种新颖的几何校验算法,可以快速发现全局几何不一致的匹配。针对几何上下文编码可能存在的一些不足,论文提出了一些增强策略,包括仿射变换估计增强、查询扩展增强等,可进一步改善检索结果。(3)论文提出了一种新颖的主视觉单词发现方法,针对车牌字符训练出一组具有丰富几何上下文的视觉单词,用于自动车牌检测。针对传统的基于图像边缘图的车牌检测方法的不足,论文从局部特征几何上下文的角度出发,提出了一种新颖的主视觉单词生成的算法。论文针对每个车牌字符训练得到一组主视觉单词,这些主视觉单词含有丰富的几何信息,如尺度、主方向、相对位置、局部描述子等;然后对测试图像,可以通过与其中的局部特征匹配的主视觉单词的几何信息,准确估计出车牌的位置。该方法生成的主视觉单词具有很强的区分能力和表达能力,而且和特定的语义概念(车牌字符)关联。总而言之,本文基于局部视觉特征,从新颖独特的视角出发,分析和挖掘蕴含在图像中的丰富的视觉上下文信息,应用于多媒体处理的几个场景。论文通过大量充分的实验,证明了所提出方法优于传统的经典算法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 国内外研究现状
  • 1.3 本文的结构安排和创新点
  • 第2章 局部视觉特征简介
  • 2.1 局部视觉特征检测
  • 2.2 局部视觉特征描述
  • 第3章 隐视觉上下文学习
  • 3.1 背景介绍
  • 3.2 相关工作
  • 3.3 框架概述
  • 3.3.1 视觉单词上下文分析
  • 3.3.2 图像上下文分析
  • 3.4 网页图像应用
  • 3.4.1 图像重排序
  • 3.4.2 典型图像挑选
  • 3.5 实验结果
  • 3.5.1 图像重排序评估
  • 3.5.2 典型图像挑选
  • 3.6 总结
  • 第4章 大规模的部分拷贝图像检索
  • 4.1 背景介绍
  • 4.2 相关工作
  • 4.3 空间编码
  • 4.3.1 算法介绍
  • 4.3.2 增强方案
  • 4.3.3 实验结果
  • 4.4 环编码
  • 4.4.1 算法介绍
  • 4.4.2 实验结果
  • 4.5 几何编码
  • 4.5.1 算法介绍
  • 4.5.2 实验结果
  • 4.6 总结
  • 第5章 基于主视觉单词发现的车牌检测
  • 5.1 背景介绍
  • 5.2 算法介绍
  • 5.2.1 主视觉单词生成
  • 5.2.2 主视觉单词匹配
  • 5.2.3 车牌定位
  • 5.3 实验结果
  • 5.3.1 性能评估
  • 5.3.2 样本结果
  • 5.4 总结
  • 第6章 总结与展望
  • 6.1 本文工作总结
  • 6.2 未来工作展望
  • 参考文献
  • 致谢
  • 在读期间发表的学术论文与取得的其他研究成果
  • 相关论文文献

    • [1].浅谈生活中的终端视觉形象[J]. 厦门科技 2019(06)
    • [2].材料特色化在品牌视觉中的呈现[J]. 西部皮革 2019(24)
    • [3].视觉行动主义——当代视觉文化中的一种新的视觉实践形态[J]. 世界美术 2019(04)
    • [4].符号学视角下新闻图像的视觉修辞分析——以《人民画报》涉农封面图像为例[J]. 新闻世界 2020(02)
    • [5].探索生活中情感的视觉传达[J]. 传播力研究 2019(35)
    • [6].基于居民幸福感的宁波老旧社区视觉形象提升策略[J]. 浙江万里学院学报 2020(01)
    • [7].论视觉语言对中西方艺术的借鉴与结合——以倪传婧插画为例[J]. 今传媒 2020(02)
    • [8].中国特色足球视觉文化建构策略研究[J]. 大众文艺 2020(03)
    • [9].新媒体环境下高校学生视觉素养提升研究[J]. 未来与发展 2020(02)
    • [10].基于视觉艺术心理学的中国山水画视觉结构语言探究[J]. 普洱学院学报 2020(01)
    • [11].服装创意设计的视觉语言[J]. 山东纺织经济 2020(01)
    • [12].动态突显对视觉搜索绩效的影响作用[J]. 人类工效学 2019(06)
    • [13].信息可视化中视觉语言的应用研究[J]. 工业设计 2020(04)
    • [14].新媒体语境下视觉词语化生产研究[J]. 传播力研究 2020(02)
    • [15].视觉传达·设计[J]. 传媒 2020(09)
    • [16].视觉文化下“网络直播”的权力争夺[J]. 美与时代(下) 2020(04)
    • [17].扬州视觉传达发展现状研究[J]. 艺海 2020(07)
    • [18].视觉文化下儿童图像识读能力的培养[J]. 西部皮革 2020(14)
    • [19].视觉训练:防控儿童青少年视力低下的方法及应用[J]. 上海体育学院学报 2020(08)
    • [20].社会主义视觉文化的“观看之道”——评唐小兵《流动的图像:当代中国视觉文化再解读》[J]. 中国现代文学研究丛刊 2020(07)
    • [21].在探索中走向明晰——关于米歇尔《跨学科性与视觉文化》及其视觉文化理论的思考[J]. 艺术教育 2020(09)
    • [22].《视觉零壹一》《视觉零壹二》[J]. 装饰 2020(07)
    • [23].新时代下城市视觉形象的重塑研究——以西安市雁塔区为例[J]. 新闻知识 2020(09)
    • [24].绘本创作中视觉隐喻表现的应用价值[J]. 美术教育研究 2020(17)
    • [25].绘本视觉语言在高校插画设计课程中应用的探索[J]. 陕西教育(高教) 2020(09)
    • [26].三宝国际瓷谷视觉集锦[J]. 景德镇陶瓷 2020(04)
    • [27].基于情感传播与共鸣的视觉语言设计[J]. 传播力研究 2020(16)
    • [28].计算机图形图像处理技术在视觉传达系统中的应用分析[J]. 信息与电脑(理论版) 2020(18)
    • [29].新媒体时代的视觉融合[J]. 新闻研究导刊 2018(21)
    • [30].无限视觉[J]. 中国无线电 2019(01)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

    基于局部特征的视觉上下文分析及其应用
    下载Doc文档

    猜你喜欢