论文摘要
随着高分辨率的数字相机成为大众普遍使用的设备,高质量数字图像更加丰富多样,数量成指数级增长,急切需要有效检索大规模图像集合的方法。尽管需求迫切,但是基于内容的图像检索(CBIR:content-based imageretrieval)技术的仍不成熟,大多数已有的CBIR系统仅能支持基于低级图像特征的检索。大多数非专业用户很难理解低级可视化特征所描述的含义,无法直观准确表达查询意图。现有的基于关键字的图像检索吸取了文本检索的优势,但缺乏对图像语义和特征统一描述的能力,难以准确建立关键字和图像间的关联。图像检索本身是希望能够在已有的广大数据库中查找所希望含有的图像信息,但是鉴于当前数据的飞速增长和已处理数据的匮乏,数据库本身的建设并不完整。而且用户更倾向于对于未知图像信息的获取,所以通过已有数据对未知数据进行预测判断的方法在现阶段更加实用。图像标记就是一种使普通用户能够轻松的使用关键字来表达他们查询目标的方法。通过使用已有的数据对待查询数据进行分析标注,从而准确表达查询数据所蕴含的信息,满足了广泛的用户需求。图像标记工具的性能很大程度上依赖两个相互关联的问题:(1)合适的表示图像内容和自动特征提取的框架;(2)有效的训练图像分类器和选择特征子集的算法。本文介绍了一种基于分割和支持向量机的半自动图像标记方法。标记对象采用家庭拍摄的自然风景类图像。方法采用图像分割技术并通过提取图像可视化描述特征来表示的景物特征,从而解决第一个问题。第二个问题通过采用支持向量机对特征数据进行学习训练得到各种自然景物的类别模型,并根据用户的相关反馈优化模型来解决。据此方法实现的系统对于自然风景类图像有较好的标记结果。图像的标记过程集成了基于关键字和图像内容的分类方法,并借助用户反馈积极的改进图像标记精度。用户提交图像得到关键字标记,提供相关反馈。反馈的正例结果添加到查询集中丰富数据,反例结果经过修正加入实际所属类别并更新类别模型。系统通过不断的查询反馈改进数据训练模型达到提高标记精度的效果。从标记效率上比较,半自动图像标记的策略要好于纯手工标记方案;从标记精确度上比较,它要好于全自动标记方法。通过反馈后的学习能得到较高的标记精确度,并且能覆盖越来越多的图像种类。标记之前描述了数据学习的准备过程,用户把标记看作重要的准备过程从而在图像检索中使用。用户通过支持相关反馈的系统接口进行学习也会指导用户改进系统。我们相信类似的方法也可以被用到其他类型多媒体对象的标记和管理。
论文目录
相关论文文献
- [1].图切技术和卷积网络的交通标志数据集构建方法[J]. 计算机应用 2017(S1)
- [2].基于局部最大熵的图像自适应标记方法[J]. 电脑知识与技术 2020(26)
- [3].一种基于标记传播的大规模图像分类方法[J]. 计算机研究与发展 2012(11)
- [4].一种利用纹理特征和朴素贝叶斯分类器检测近景影像植被的方法[J]. 武汉大学学报(信息科学版) 2013(06)