论文摘要
随着图像获取设备的普及和数字存储设备成本的降低,大量未经组织的数字图像出现在互联网上和个人电脑中。如何组织管理数字图像,并在需要时进行高效的检索和浏览,已成为一个重要的应用问题。本文在基于内容的图像检索应用背景下,从以下三个方面提出并解决了若干相关的机器学习问题,从而提高了图像检索算法的性能,减少了图像检索过程中所需的用户操作,改善了用户体验。首先,在用户对整张图片标注正确与否的相关反馈机制下,本文提出了在允许用户一次标注多张图片时如何选择最优的图片集的问题,并通过基于采样的主动学习算法解决了这一问题。和传统的基于贪婪优化的主动学习算法相比,减少了达到同等检索性能所需的用户标注工作量。其次,本文提出了基于用户在图片内部画线的新型相关反馈机制,使得用户可以方便的输入更细致具体的感兴趣区域信息,从而为检索算法提高性能提供了更大的空间。本文还提出了将基于用户画线和基于对单张图片标注两种相关反馈方法结合起来的统一框架。第三,为进一步提高单纯依靠底层视觉特征进行图像检索的性能,本文提出首先利用底层视觉特征对图像进行文字标注,然后利用文字标注进行检索。由于这样的标注过程利用了更多的监督信息,因此产生的文字标注比视觉特征更接近图像的真实语义,基于这些标注的图像检索算法会具有更好的性能。另外,本文介绍了课题进行期间设计并实现的图像检索系统。该系统作为一个通用平台,可以完成图片下载、索引、特征提取、检索等典型图像检索系统的功能,并可以方便的替换各个步骤中使用的算法,从而为尝试新的算法并测试其性能提供了便利。
论文目录
摘要Abstract第1章 绪论1.1 选题背景与研究意义1.2 基本概念与热点问题1.2.1 特征提取1.2.2 请求形成1.2.3 排序算法1.2.4 语义鸿沟1.2.5 相关反馈1.3 主要工作与章节安排第2章 基于批量主动学习的相关反馈2.1 问题提出2.2 相关工作2.3 算法框架2.4 变型空间的减小2.4.1 变型空间的概念2.4.2 SVM变型空间的对偶性及几何解释2.4.3 变型空间的减小与SVM主动学习2.4.4 期望的变型空间减小量2.5 在变型空间中采样2.6 基于批量主动学习的相关反馈2.6.1 以一定置信概率达到最优2.6.2 使用候选集2.6.3 最终算法2.7 计算复杂度分析2.8 实验结果2.8.1 棋盘格人工合成数据2.8.2 实际数据2.9 本章小结第3章 基于在图片内部绘制线条的相关反馈3.1 相关工作3.2 相关反馈机制设计3.3 相关反馈信息获取3.4 与传统方法的结合3.4.1 估计区域的软标签3.4.2 估计图像的软标签3.5 协作式的图像分割3.5.1 算法动机3.5.2 分割算法3.6 系统实现3.7 实验结果3.8 本章小结第4章 基于底层视觉特征的图像标注4.1 问题的提出4.2 基于隐语义模型的图像标注与检索4.2.1 基于Bag of Words的图像表示4.2.2 概率隐语义分析方法4.2.3 概率隐语义分析与图像距离度量4.2.4 初步实验结果4.3 基于非参数条件随机场的物体分割4.3.1 马尔可夫随机场(MRF)和条件随机场(CRF)4.3.2 CRF分割算法4.4 本章小结第5章 图像检索系统的设计和实现5.1 设计目标5.2 数据层设计5.3 逻辑层设计5.4 表示层设计5.5 本章小结第6章 结论6.1 主要贡献6.2 研究展望参考文献致谢个人简历、在学期间发表的学术论文与研究成果
相关论文文献
标签:基于内容的图像检索论文; 相关反馈论文; 主动学习论文; 物体识别论文; 人机交互论文;