网络社区图像检索中的排序研究

网络社区图像检索中的排序研究

论文摘要

图像社区是随着web2.0和多媒体技术的发展与普及而产生的一类社交平台,作为一种新兴的网络应用,每天都有成千上万的用户将他们的本地图像上传至网络并添加标签、相应的描述等与人们共享。有效的组织、管理以及如何从如此海量的图像库中检索出所需要的图像已经成为学术界和产业界日益关注的问题。基于内容的图像检索(content-based image retrieval,简称CBIR)利用图像的底层视觉特征(颜色,纹理,形状等)来代表图像的内容,图像的视觉内容被用来索引。CBIR面临的主要困难是语义鸿沟问题,即图像的底层视觉特征不能有效的表达图像的语义内容;基于文本的图像检索(text-based image retrieval,简称TBIR)主要依赖于图像所处的网络上下文环境来判断图像的主题内容,例如可以首先对图像的文件名、AIT标签文本、锚文本以及用户提供的标签、描述等图像周边文本建立索引,然后进行基于文本的图像检索。TBIR的局限在于图像的周边文本质量并不高,存在大量的噪声,很难判断哪些文本是真正与图像内容相关,用户添加的文本内容存在主观性和模糊性。在本文中,我们充分利用了图像的文本信息和视觉信息,通过将两者有效的融合来解决上面提到的问题。另一方面,由于互联网环境下图像数量爆炸式的增长,检索返回的结果相当多,然而人们通常只关注排在前面的结果,因此“好”的结果排在前面是对一个图像检索系统的基本要求。这个“好”体现在返回的图像在具有高相关性的同时具有多样性。在一些只考虑了相关性的研究中,每幅图像与查询词的相关性是独立考虑的,这样,结果中图像与图像之间的关系就被忽略了。一个返回很多相关但是重复图像很多的结果,虽然取得了较高的相关性,但是能提供给用户的信息量却很少;再者,基于查询词的检索方式不可避免的会具有二义性,不同的用户键入的同一个查询词可能具有不同的检索意图,为了最大限度的满足不同用户的不同的检索需求,检索结果的主题多样性也很重要。为此,本文给出了一个贪婪的图像多样性惩罚算法,保证最终的图像检索排序结果在具有较高相关性的同时兼具多样性。本文的研究着眼于网络社区中的图像检索排序问题,主要有以下贡献:1.选择并提取图像的文本特征和视觉特征,使用形成的特征分别计算图像之间的文本相似度和视觉相似度,然后基于得到的相似度将图像集合构建成两个个相似度图:文本相似度图和视觉相似度图。在这两个相似度图上各自使用随机游走模型,从而得到两个初始的图像排名序列。2.为了将分别使用文本特征和视觉特征得到的初始图像排名序列相融合,本文提出了两种合并策略:基于排名分数的合并策略和基于排名位置的合并策略。在实验部分,我们将两种合并策略进行了比较。3.在图像的排序结果具有较高相关性的同时,我们还期望图像排序结果有较高的多样性,为此,本文给出了一种图像多样性惩罚贪婪算法。该算法通过迭代,逐步消减图像排序中与排在其前面的图像具有高相似度的图像的分数,从而使最终的图像排序结果在具有较高相关性的同时兼具多样性。最后,实验分别在P@n、MAP、NDCG和Average Image等测度上证明了模型的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 相关研究工作
  • 1.3 本文的主要工作
  • 1.4 本文的组织
  • 第二章 图像检索发展简述
  • 2.1 概述
  • 2.2 基于文本信息的图像检索
  • 2.2.1 早期的TBIR
  • 2.2.2 互联网环境下的TBIR
  • 2.2.3 存在的问题
  • 2.3 基于图像内容的图像检索
  • 2.3.1 图像的底层视觉特征
  • 2.3.2 图像相似性计算
  • 2.3.3 典型的CBIR系统
  • 2.3.4 存在的问题
  • 2.4 基于文本信息和视觉信息相融合的图像检索
  • 2.5 小结
  • 第三章 面向网络社区平台的图像检索排序模型
  • 3.1 引言
  • 3.2 基础知识
  • 3.2.1 Flickr图像特点
  • 3.2.2 向量空间模型
  • 3.2.3 SIFT算法
  • 3.3 模型描述
  • 3.3.1 视觉相似度图的构建
  • 3.3.2 文本相似度图的构建
  • 3.3.3 随机游走过程
  • 3.3.4 融合策略
  • 3.3.5 视觉多样性惩罚算法
  • 3.4 小结
  • 第四章 相关实验
  • 4.1 实验数据
  • 4.2 评价测度
  • 4.3 参数设定
  • 4.4 实验与结果分析
  • 4.4.1 不同查询词间的结果比较
  • 4.4.2 与基准方法的结果比较
  • 4.4.3 视觉多样性惩罚算法的有效性验证
  • 第五章 总结与展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].基于曲线相似度的飞行着陆操作评价方法[J]. 交通信息与安全 2019(06)
    • [2].基于域间相似度序数的迁移学习源领域的选择[J]. 科学技术与工程 2020(20)
    • [3].一种图文组合相似度算法的设计与优化[J]. 软件工程 2020(08)
    • [4].基于超网络的微博相似度及其在微博舆情主题发现中的应用[J]. 图书情报工作 2020(11)
    • [5].说之以理[J]. 人力资源 2020(21)
    • [6].一种双层的微博用户相似度算法[J]. 情报杂志 2018(06)
    • [7].基于情景的结构化突发事件相似度研究[J]. 中国管理科学 2017(01)
    • [8].基于混合相似度的协同过滤推荐[J]. 软件导刊 2017(02)
    • [9].基于干扰相似度的多话题演化模型[J]. 电信科学 2017(09)
    • [10].软件相似度在成本估算中的应用[J]. 计算机应用与软件 2015(06)
    • [11].一种基于函数依赖的属性相似度调整算法[J]. 上海交通大学学报 2015(08)
    • [12].河马找亲戚[J]. 学生之友(童花果) 2016(12)
    • [13].十个中文流行语翻译[J]. 初中生辅导 2016(36)
    • [14].母爱[J]. 少年月刊 2017(05)
    • [15].基于多种测度的术语相似度集成计算研究[J]. 情报学报 2013(06)
    • [16].基于余弦相似度分类负荷预测[J]. 电力设备管理 2020(09)
    • [17].基于多尺度相似度特征的答案选择算法[J]. 系统工程与电子技术 2018(06)
    • [18].基于服务相似度的移动用户近似邻居选取方法[J]. 计算机工程 2018(05)
    • [19].基于文本属性的微博用户相似度研究[J]. 计算机技术与发展 2018(05)
    • [20].基于属性相似度的碎多边形自动聚合处理[J]. 测绘与空间地理信息 2013(11)
    • [21].改进填补法和多权重相似度相结合的推荐算法[J]. 计算机应用研究 2020(12)
    • [22].基于共同邻居相似度的社区发现算法[J]. 信息系统工程 2014(05)
    • [23].色谱指纹图谱相似度方法的适应性研究[J]. 中国中医药信息杂志 2012(05)
    • [24].基于向量空间模型附加词义特征的句子相似度研究[J]. 成都信息工程学院学报 2012(03)
    • [25].中国-东盟自贸区二周年的比较研究——基于出口相似度与显性比较优势的分析[J]. 安徽行政学院学报 2012(03)
    • [26].色谱指纹图谱相似度方法的研究进展[J]. 中国实验方剂学杂志 2011(02)
    • [27].基于元相似度的推荐算法[J]. 计算机应用研究 2011(10)
    • [28].互信息启发的相似度组合图像检索算法[J]. 中国图象图形学报 2011(10)
    • [29].相似度法在综合分析投资环境中的应用[J]. 统计与决策 2009(15)
    • [30].一种改进相似度的协同过滤算法实现[J]. 电子科技 2020(02)

    标签:;  ;  ;  ;  ;  

    网络社区图像检索中的排序研究
    下载Doc文档

    猜你喜欢