基于AIE的半自动Web页标注关键技术研究

基于AIE的半自动Web页标注关键技术研究

论文摘要

实现语义Web构想的关键是创建本体,并使用本体词汇对Web内容进行语义标注。在标注工具中集成信息提取(IE)技术,可大大提高语义标注工具的自动化程度、减轻用户负担。而自适应IE系统(AIE)使用机器学习,能自动从训练数据中学习信息提取的规则,以适用于新的应用和领域,这正是语义Web环境的需求。 本文分析了现有的集成AIE的语义标注工具的技术特性,指出它们的两个主要不足之处:不支持W3C的标准Web本体语言OWL和使用的IE功能较为简单。据此,本文首先提出了一个基于AIE的Web页半自动标注工具的框架,它支持OWL Lite本体语言,借助自适应信息提取系统Amilcale提供的自动信息提取功能,实现Web页的半自动语义标注。针对现有语义标注工具的以上两个缺点,在本文的标注工具的框架中,选择了两个关键技术进行深入研究:①基于Amilcare用主动学习方法半自动提取待标注事实的技术;②利用提取的待标注事实产生OWL Lite语义元数据的技术。本文通过对Amilcare及其应用编程接口(API)的深入研究,提出了在半自动标注工具中实现基于Amilcare的主动学习、半自动提取待标注事实的方法和流程,给出了相应的设计与实现技术;在对OWL Lite语言的构造子及约束进行分析总结的基础上,描述了Web页语义元数据应有的结构以及使用提取的待标注事实生成语义元数据的设计思想与实现技术。案例研究和实验表明:本文提出的技术方案是合理和可行的。

论文目录

  • 第一章 绪论
  • 1.1 研究背景与选题依据
  • 1.2 研究目标与内容
  • 1.3 相关技术现状综述
  • 1.3.1 OWL本体语言
  • 1.3.2 Amilcare应用程序开发周期
  • 1.3.3 集成 Amilcare的语义标注工具
  • 1.4 本文组织
  • 第二章 基于 AIE的半自动标注框架及其关键技术
  • 2.1 基于 AIE的WEB页标注框架
  • 2.2 用主动学习方法半自动提取待标注事实
  • 2.2.1 Amilcare的API
  • 2.2.2 场景文件
  • 2.2.3 基于主动学习的待标注事实半自动提取方法
  • 2.3 根据提取的待标注事实产生语义元数据
  • 2.3.1 OWL Lite构造子及约束
  • 2.3.2 语义元数据
  • 2.3.3 语义元数据文档
  • 2.3.4 语义元数据的生成
  • 2.4 本章小结
  • 第三章 关键技术的实现
  • 3.1 开发工具和平台
  • 3.2 重要数据结构及工作界面
  • 3.2.1 个体的内部数据结构
  • 3.2.2 工作界面和新增功能菜单
  • 3.3 用主动学习方法半自动提取待标注事实
  • 3.3.1 训练文档生成
  • 3.3.2 场景文件生成
  • 3.3.3 Amilcare学习、提取、作出标注建议
  • 3.3.4 用户验证
  • 3.3.5 计算正确度
  • 3.4 利用提取的待标注事实生成语义元数据
  • 3.4.1 个体创建
  • 3.4.2 填充个体信息
  • 3.4.3 本体实例文档生成
  • 3.5 本章小结
  • 第四章 案例研究
  • 4.1 案例介绍
  • 4.2 用主动学习方法半自动提取待标注事实
  • 4.3 用提取的待标注事实生成语义元数据
  • 4.4 本章小结
  • 第五章 总结与展望
  • 5.1 本文总结
  • 5.2 工作展望
  • 致谢
  • 参考文献
  • 附录 ○WL LITE本体文档 PERSON.OWL
  • 相关论文文献

    • [1].数据标注研究综述[J]. 软件学报 2020(02)
    • [2].群智标注系统中质量管理设计与实现[J]. 舰船电子工程 2020(05)
    • [3].社会化标注系统用户标注动机研究:基于扎根理论的视角[J]. 情报科学 2020(07)
    • [4].语言标注框架评述与对比分析[J]. 网络新媒体技术 2019(03)
    • [5].教育信息资源用户标注模型构建及仿真研究[J]. 现代远距离教育 2017(01)
    • [6].图像标注中的用户标注模式与心理研究[J]. 情报学报 2015(05)
    • [7].医疗语义众包标注平台设计和应用研究[J]. 医学信息学杂志 2020(07)
    • [8].基于众包标注提高教学效果的探索[J]. 科教导刊(上旬刊) 2020(08)
    • [9].面向特定标注数据稀缺领域的命名实体识别[J]. 指挥信息系统与技术 2019(05)
    • [10].基于数据均衡的增进式深度自动图像标注[J]. 软件学报 2017(07)
    • [11].基于超网络的社会化标注行为[J]. 系统工程 2015(03)
    • [12].巧用标注手段,助力阅读理解[J]. 广东教育(高中版) 2019(10)
    • [13].网络环境下大众标注行为动机的调查与分析[J]. 图书情报工作 2013(23)
    • [14].自动图像标注技术综述[J]. 计算机研究与发展 2020(11)
    • [15].来稿中作者署名的标注要求[J]. 西部医学 2010(02)
    • [16].本刊关于标注“通讯作者”的说明[J]. 中国中西医结合影像学杂志 2010(03)
    • [17].科技论文“一文多注(标注)”现象分析[J]. 科学学研究 2009(05)
    • [18].国外社会化标注系统中标注行为研究现状[J]. 情报杂志 2009(11)
    • [19].国外大众标注系统研究进展[J]. 图书馆杂志 2008(11)
    • [20].大众标注研究进展[J]. 图书情报工作 2008(01)
    • [21].汉英篇章结构平行语料库的对齐标注研究[J]. 中文信息学报 2013(06)
    • [22].社会标注系统质量对用户标注意愿的影响机理[J]. 图书馆论坛 2019(06)
    • [23].深度学习图像标注与用户标注比较研究[J]. 数据分析与知识发现 2018(05)
    • [24].用户社会化标注中非理性行为的表现及原因分析[J]. 数字图书馆论坛 2016(12)
    • [25].基于深度学习的自动图像标注研究与实现[J]. 中国高新技术企业 2017(03)
    • [26].汉语二语教学领域词义标注语料库的研究及构建[J]. 中文信息学报 2017(01)
    • [27].汉英篇章结构平行语料库的对齐标注评估[J]. 中文信息学报 2017(03)
    • [28].国内社会标注研究现状及发展趋势[J]. 晋图学刊 2015(06)
    • [29].浅议图书标注发展中的问题解析及对策[J]. 科技创业月刊 2016(17)
    • [30].我院67份滴眼液说明书标注项的调查与分析[J]. 中国药房 2015(13)

    标签:;  ;  ;  ;  

    基于AIE的半自动Web页标注关键技术研究
    下载Doc文档

    猜你喜欢