基于机器学习算法的自动图像标注

基于机器学习算法的自动图像标注

论文摘要

“语义清晰”是大规模数字图像管理的重要前提,现有的基于底层特征的图像内容和高级人为理解的图像语义之间存在巨大的鸿沟,因此通过计算机自动获取图像语义内容的研究具有十分重要的意义。自动图像标注的实质是通过对图像的底层视觉特征的处理和分析来获取高层语义关键词,用这组语义关键词表示图像的含义。基于分类的自动图像标注方法是当前图像标注领域中使用最广泛的方法之一。本文的研究目标是结合当前标注模型的特点应用机器学习算法对图像进行标注,与前期基于分类模型的自动图像标注经典算法相比,本文采用的决策树改进算法在分类精度和时间上有所改善,并且该系统可以利用人能理解的规则模型来标注图像。为了获取标注规则,本文将采集到的图像数据库预定义一组需要的关键词(或语义概念)。利用图像分割技术将数据库中的图像分割成许多不同的区域,每个区域大致对应于一个语义对象。然后对图像分割后所得到的各个区域提取出底层视觉特征,包括颜色、纹理和形状特征等。提取出区域的特征属性后,手动将有意义的区域归并为几个类,这几个类均为预定义的语义概念。特征属性数据可以作为后续机器学习的训练数据。然后该系统可以通过机器学习方法从这些特征数据中学习到语义概念,利用预定义关键词来标注各个区域,最后图像就可以被这些关键词标注出来。本文主要关注的机器学习算法为改进后的NewNBtree算法、SimpleC4.5算法和FastRandomForest算法,通过训练可以得到相应的标注模型,最终实现自动图像标注。在自动语义标注阶段,本文利用图像信息熵的概念对噪声区域进行剔除,更有效地提高了标注系统的准确度。本文通过标准Corel图像库和基于Corel图像库的不同10组训练集对采用的算法进行实验分析,验证了改进算法和标注系统的有效性和鲁棒性。实验结果表明本文所采用的机器学习算法比传统决策树算法更能有效地分类图像数据,并能够应用到较大规模图像集中实现图像的自动标注。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第1章 绪论
  • 1.1 研究背景与研究意义
  • 1.2 国内外研究现状
  • 1.2.1 基于分类的自动图像标注模型
  • 1.2.2 基于概率的自动图像标注模型
  • 1.2.3 其他方法
  • 1.3 图像标注系统关键问题及研究任务
  • 1.3.1 自动标注系统的框架
  • 1.3.2 关键问题
  • 1.3.3 研究任务
  • 1.4 本文的结构安排
  • 第2章 基于单棵决策树的自动图像标注
  • 2.1 NewNBtree算法
  • 2.1.1 算法思想
  • 2.1.2 算法流程
  • 2.1.3 算法实现
  • 2.2 SimpleC4.5算法
  • 2.2.1 算法思想
  • 2.2.2 算法流程
  • 2.2.3 算法实现
  • 2.3 自动图像标注方法
  • 2.3.1 自动图像标注流程
  • 2.3.2 自动图像标注算法描述
  • 2.4 本章小结
  • 第3章 基于集成分类器的自动图像标注
  • 3.1 集成分类器
  • 3.1.1 集成学习算法
  • 3.1.2 快速随机森林算法
  • 3.2 基于快速随机森林算法的自动图像标注方法
  • 3.2.1 基于快速随机森林的自动图像标注流程
  • 3.2.2 基于快速随机森林的图像自动标注算法描述
  • 3.3 本章小结
  • 第4章 系统实现及结果分析
  • 4.1 实验环境
  • 4.2 Weka平台的二次开发
  • 4.2.1 二次开发过程
  • 4.2.2 二次开发实验
  • 4.3 实验及结果分析
  • 4.3.1 实验数据集
  • 4.3.2 评价标准
  • 4.3.3 基于机器学习算法的分类结果比较及分析
  • 4.3.4 基于机器学习算法的标注系统实现
  • 4.4 本章小结
  • 结论
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文及科研成果
  • 相关论文文献

    • [1].数据标注研究综述[J]. 软件学报 2020(02)
    • [2].群智标注系统中质量管理设计与实现[J]. 舰船电子工程 2020(05)
    • [3].社会化标注系统用户标注动机研究:基于扎根理论的视角[J]. 情报科学 2020(07)
    • [4].语言标注框架评述与对比分析[J]. 网络新媒体技术 2019(03)
    • [5].教育信息资源用户标注模型构建及仿真研究[J]. 现代远距离教育 2017(01)
    • [6].图像标注中的用户标注模式与心理研究[J]. 情报学报 2015(05)
    • [7].医疗语义众包标注平台设计和应用研究[J]. 医学信息学杂志 2020(07)
    • [8].基于众包标注提高教学效果的探索[J]. 科教导刊(上旬刊) 2020(08)
    • [9].自动图像标注技术综述[J]. 计算机研究与发展 2020(11)
    • [10].面向特定标注数据稀缺领域的命名实体识别[J]. 指挥信息系统与技术 2019(05)
    • [11].基于数据均衡的增进式深度自动图像标注[J]. 软件学报 2017(07)
    • [12].基于超网络的社会化标注行为[J]. 系统工程 2015(03)
    • [13].巧用标注手段,助力阅读理解[J]. 广东教育(高中版) 2019(10)
    • [14].网络环境下大众标注行为动机的调查与分析[J]. 图书情报工作 2013(23)
    • [15].来稿中作者署名的标注要求[J]. 西部医学 2010(02)
    • [16].本刊关于标注“通讯作者”的说明[J]. 中国中西医结合影像学杂志 2010(03)
    • [17].科技论文“一文多注(标注)”现象分析[J]. 科学学研究 2009(05)
    • [18].国外社会化标注系统中标注行为研究现状[J]. 情报杂志 2009(11)
    • [19].国外大众标注系统研究进展[J]. 图书馆杂志 2008(11)
    • [20].大众标注研究进展[J]. 图书情报工作 2008(01)
    • [21].汉英篇章结构平行语料库的对齐标注研究[J]. 中文信息学报 2013(06)
    • [22].社会标注系统质量对用户标注意愿的影响机理[J]. 图书馆论坛 2019(06)
    • [23].深度学习图像标注与用户标注比较研究[J]. 数据分析与知识发现 2018(05)
    • [24].用户社会化标注中非理性行为的表现及原因分析[J]. 数字图书馆论坛 2016(12)
    • [25].基于深度学习的自动图像标注研究与实现[J]. 中国高新技术企业 2017(03)
    • [26].汉语二语教学领域词义标注语料库的研究及构建[J]. 中文信息学报 2017(01)
    • [27].汉英篇章结构平行语料库的对齐标注评估[J]. 中文信息学报 2017(03)
    • [28].国内社会标注研究现状及发展趋势[J]. 晋图学刊 2015(06)
    • [29].浅议图书标注发展中的问题解析及对策[J]. 科技创业月刊 2016(17)
    • [30].我院67份滴眼液说明书标注项的调查与分析[J]. 中国药房 2015(13)

    标签:;  ;  ;  ;  

    基于机器学习算法的自动图像标注
    下载Doc文档

    猜你喜欢