结合底层特征和高层语义的图像检索技术研究

结合底层特征和高层语义的图像检索技术研究

论文摘要

随着计算机技术和多媒体技术的快速发展,多媒体图像的数量也以得到了极大地增长,如何从海量的图像库中快速、准确的检索到所需求的图像成为了当今多媒体技术中研究的热点问题。传统的基于文本的图像检索技术需要管理员手工对图像进行标注,不仅消耗了大量的人力,而且人工标注图像的主观性很大,对于不同的管理员,标注的结果可能不同。基于内容的图像检索技术是依靠图像的低层视觉特征(颜色、纹理、形状等)来进行检索的,但是人对图像的认识是一个利用自己的先验知识推理图像语义的过程,这样导致了图像的底层视觉特征和图像语义之间的“语义鸿沟”。为了减小“语义鸿沟”,本文将图像的高层语义和底层视觉特征结合起来,利用支持向量机(SVM)将图像的底层特征映射为高层语义。本文首先对语义的层次模型进行了分析,并且介绍了提取图像语义的一些常用方法。在分析了图像颜色、纹理、形状等特征提取方法的基础上,提出采用结合图像边缘和角点信息的低层特征提取方法,分别用不变矩和环形颜色直方图来表示图像的边缘和角点信息。本文重点研究了支持向量机的多分类技术,针对一些传统方法支持向量机多分类的缺点,例如:正负样本分布不均匀、识别率低、训练时间长等,提出了一种新的二叉树结构的SVM分类方法。以样本的空间分布为切入点,利用K-Mean聚类分析样本语义类之间的空间分布,采用聚类中心的欧氏距离作为量度,在树形结构SVM的根节点中首先确定空间距离最大的两个类别,将这两个类别分别确定为SVM正类和负类的中心,其他类根据它们与此两类的距离被分配到其对应的SVM类别中。对其他结点SVM类别,再按照根节点同样方式进行分类,直到最后得到单一的类别。以这种分配SVM正负类别的方式训练树形SVM,正负类别比较均匀,先分离开距离较远的类别,避免了它们对后续分类的干扰,提高了分类的准确率,而且除了根节点之外的节点中SVM所有数据量比其他树形结构方法都有很大减少,缩短了SVM的训练时间。实验结果表明,该方法在保证准确率的同时可以在较大程度上缩短图像检索时间。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 课题研究背景和意义
  • 1.2 研究现状
  • 1.3 本文的研究内容和章节安排
  • 2 图像语义检索技术介绍
  • 2.1 图像语义模型
  • 2.2 图像的语义表示
  • 2.2.1 文本表示法
  • 2.2.2 知识表示法
  • 2.2.3 MPEG-7
  • 2.3 图像语义的提取方法
  • 2.3.1 底层视觉特征到高层语义的直接映射
  • 2.3.2 基于关键字的语义网络
  • 2.3.3 语义向量
  • 3 底层视觉特征提取
  • 3.1 颜色特征
  • 3.1.1 颜色空间
  • 3.1.2 HSV 颜色空间
  • 3.1.3 RGB 空间到HSV 空间的转换
  • 3.2 颜色特征的表示
  • 3.3 纹理特征
  • 3.3.1 灰度共生矩阵
  • 3.3.2 纹理谱
  • 3.4 形状特征
  • 3.4.1 形状特征描述子
  • 3.4.2 傅立叶描述子
  • 4 结合图像边缘和角点的特征提取
  • 4.1 算法思想和结构
  • 4.2 图像边缘提取
  • 4.3 图像边缘的特征表示
  • 4.4 图像角点的提取
  • 4.5 基于角点环形颜色直方图提取
  • 5 基于树形 SVM 的语义分类
  • 5.1 支持向量机基本理论
  • 5.1.1 支持向量机基本原理
  • 5.1.2 SVM 构造的多分类器
  • 5.2 树形结构SVM 多分类
  • 5.3 核函数选择
  • 5.4 分类器参数确定
  • 5.5 时间复杂度分析
  • 6 实验结果与分析
  • 6.1 结合底层特征和高层语义的图像检索流程
  • 6.2 图像检索性能评价标准
  • 6.3 样本的空间分布
  • 6.4 实验结果与分析
  • 7 总结与展望
  • 致谢
  • 参考文献
  • 附录 A 作者在攻读硕士学位期间发表的论文目录
  • 相关论文文献

    • [1].基于内容的图像检索高层语义处理方法[J]. 图书情报工作 2009(09)
    • [2].基于高层语义视觉表征的意象版工具[J]. 包装工程 2018(04)
    • [3].2014年《计算机研究与发展》专题(正刊)征文通知——“深度学习”[J]. 计算机研究与发展 2014(01)
    • [4].基于多层次特征表示的图像场景分类算法[J]. 高技术通讯 2019(03)
    • [5].2014年《计算机研究与发展》专题(正刊)征文通知——“深度学习”[J]. 计算机研究与发展 2013(12)
    • [6].基于语义交互的三维重建[J]. 计算机辅助设计与图形学学报 2011(05)
    • [7].基于不同模态语义匹配的跨媒体检索[J]. 山东师范大学学报(自然科学版) 2017(03)
    • [8].2014年《计算机研究与发展》专题(正刊)征文通知——“深度学习”[J]. 计算机研究与发展 2014(02)
    • [9].融合语义先验和渐进式深度优化的宽基线3维场景重建[J]. 中国图象图形学报 2019(04)
    • [10].基于特征通道和空间联合注意机制的遮挡行人检测方法[J]. 电子与信息学报 2020(06)
    • [11].基于深度特征融合的图像分类算法的研究[J]. 计算机应用与软件 2020(10)
    • [12].现勘图像检索综述[J]. 电子学报 2018(03)
    • [13].基于语义的视频检索综述[J]. 数字技术与应用 2017(05)
    • [14].基于高层语义视觉词袋的色情图像过滤模型[J]. 计算机应用 2011(07)
    • [15].一种基于层次语义图像分类的改进方法[J]. 计算机应用与软件 2013(09)
    • [16].一种基于自学习的动态语义网络的图像检索方法[J]. 西南师范大学学报(自然科学版) 2010(02)
    • [17].基于内容的音乐语义特征描述方法[J]. 电子设计工程 2013(01)
    • [18].基于分块权值的语义图像检索[J]. 计算机科学 2013(09)
    • [19].多媒体高层语义框架及检索算法[J]. 吉林大学学报(工学版) 2011(01)
    • [20].融合底层、语义特征的医学图像检索算法及实现[J]. 黄山学院学报 2008(05)
    • [21].基于目标区域的语义图像检索[J]. 计算机工程与应用 2008(20)
    • [22].基于高层语义注意力机制的中文实体关系抽取[J]. 广西师范大学学报(自然科学版) 2019(01)
    • [23].低层特征与高层语义融合的人体行为识别方法[J]. 小型微型计算机系统 2018(04)
    • [24].基于四层树状语义模型的场景语义识别方法[J]. 电子设计工程 2017(23)
    • [25].“没完没了地VP”与相关结构——兼谈非终结图式与渐次扫描[J]. 汉语学习 2011(03)
    • [26].基于MPEG—7标准的行人模型描述与实现[J]. 科学技术与工程 2010(04)
    • [27].一种基于SVMS的语义图像分类方法[J]. 计算机应用研究 2008(02)
    • [28].一种新的图像语义与视觉特征的映射方法[J]. 计算机应用 2008(10)
    • [29].复制式协同CAD环境下隐式特征造型技术[J]. 河南科技 2011(02)
    • [30].一种基于眼动的网购商品推荐方法[J]. 系统工程 2016(08)

    标签:;  ;  ;  ;  

    结合底层特征和高层语义的图像检索技术研究
    下载Doc文档

    猜你喜欢