基于语义Web技术的非结构化文档管理方法研究

基于语义Web技术的非结构化文档管理方法研究

论文摘要

目前,伴随着数据库技术、数据挖掘技术、数据仓库技术等的成熟和广泛应用,结构化文档管理问题已经基本得到解决;信息技术的广泛应用带来非结构化文档激增,但对其应用效率低下,而新兴管理思想的涌现以及全球化竞争的日益加剧迫切要求对组织中的非结构化文档资源进行有效的管理。非结构化文档管理正日益成为互联网时代信息资源管理的一个关键问题。本文将语义Web技术及标准引入非结构化文档的分析、标记和应用过程,以形成一套有效的非结构化文档管理方法,满足企业应用的迫切需求。本文首先系统介绍了语义Web的相关理论,其中重点是语义Web的三大关键技术:XML、RDF及本体。之后围绕非结构化文档管理生命周期的全过程:获取、标记、组织/存储及应用,分析了每个环节目前还存在的问题。之后引入语义Web技术进行分析和解决,重点解决了:1)文档标记中涉及到的标记语言(外表特征和内容特征两方面)、标记过程及标记工具,并最终形成完整的结构化的标记描述,以利于计算机进行理解和自动处理;2)组织方法采用基于本体的组织方法代替传统线性组织方法,以满足分布式的网络信息组织的需要,同时存储方式采取监督机制来协同源文档和标记文档之间的同步关系,以确保两者同时更改和删除;3)最后具体的应用则从信息检索、自动分类、智能推理三个方向来分析:信息检索时利用本体进行查询扩展,并根据语义相似度进行检索排序;自动分类则以领域本体作为分类树,以形成动态统一的分类标准;智能推理方面则利用本体和描述逻辑来实现计算机理解的、规范化的描述,并利用描述逻辑的推理功能进行智能推理。最后,在完成前面分析和解决问题的基础上,形成了完整的非结构化文档管理框架,详细描述非结构化文档管理生命周期的全过程,并设计了一个企业邮件管理原型系统,以验证研究的可行性和正确性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究的意义及其目的
  • 1.2 国内外研究综述
  • 1.2.1 非结构化文档管理与相关领域研究的关系
  • 1.2.2 基于语义 Web 的非结构化文档管理研究
  • 1.3 本论文的研究背景
  • 1.4 本主要研究内容
  • 第二章 语义 Web 技术
  • 2.1 可扩展标记语言 XML
  • 2.2 资源描述框架 RDF
  • 2.3 本体 Ontology
  • 2.4 本章小结
  • 第三章 非结构化文档管理全生命周期过程分析
  • 3.1 非结构化文档的获取
  • 3.2 非结构化文档的标记
  • 3.2.1 标记语言及过程
  • 3.2.2 标记工具
  • 3.3 非结构化文档的组织与存储
  • 3.3.1 非结构化文档的组织
  • 3.3.2 非结构化文档的存储
  • 3.4 非结构化文档的应用分析
  • 3.4.1 信息检索
  • 3.4.2 自动分类
  • 3.4.3 智能推理
  • 3.5 本章小结
  • 第四章 语义 Web 技术在非结构化文档管理中的应用分析
  • 4.1 基于语义 Web 技术的标记方法研究
  • 4.1.1 引入 Dublin Core 的外表特征标记研究
  • 4.1.2 基于语义标注的内容特征标记研究
  • 4.1.3 基于 RDF 的标记描述研究
  • 4.2 基于标记的非结构化文档的组织与存储方法
  • 4.2.1 基于本体的组织方法
  • 4.2.2 非结构化文档的存储方法
  • 4.3 基于标记的非结构化文档的应用方法
  • 4.3.1 信息检索
  • 4.3.2 自动分类
  • 4.3.3 智能推理
  • 4.4 本章小结
  • 第五章 基于语义 Web 技术的非结构化文档管理方法及其实现
  • 5.1 非结构化文档管理系统模块框架
  • 5.2 非结构化文档管理技术及工具集成
  • 5.3 非结构化文档管理实现过程描述
  • 5.4 原型系统及其应用简介
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 未来研究展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 附录
  • 相关论文文献

    • [1].云计算环境中结构化文档形式化建模[J]. 计算机应用 2013(05)
    • [2].非结构化文档的标记方法研究[J]. 中国管理信息化 2012(04)
    • [3].基于XML技术的结构化文档编辑器研究[J]. 软件 2014(05)
    • [4].基于CSS的结构化文档视觉信息伪装技术实现[J]. 软件导刊 2013(01)
    • [5].内容库在政府信息公开系统中的应用研究[J]. 计算机应用与软件 2019(11)
    • [6].基于Lucene的非结构化文档全文检索系统研究与实现[J]. 软件导刊 2013(10)
    • [7].如何使用Visual Basic读取XML文件[J]. 黑龙江气象 2011(03)
    • [8].基于Hadoop的XML查询[J]. 信息通信 2016(12)
    • [9].基于结构化文档的钓鱼网站检测算法[J]. 计算机工程与设计 2019(10)
    • [10].文档数据库相关关键技术研究[J]. 电子技术与软件工程 2015(19)
    • [11].基于JATS标准的医学期刊电子资源格式处理与转化[J]. 中国科技期刊研究 2018(08)
    • [12].统一的商业绩效管理[J]. 软件世界 2009(04)
    • [13].XML语言在Web开发中的应用研究[J]. 软件导刊 2013(12)
    • [14].面向多级安全的结构化文档描述模型[J]. 通信学报 2012(S1)
    • [15].搜索处理技术在医院非结构化文档(电子病历)的应用[J]. 中国数字医学 2013(06)
    • [16].用BIM“智”造特大型桥梁[J]. 中国公路 2018(11)
    • [17].利用JavaScript编程在Indesign中实现基于XML结构化文档的自动排版[J]. 中国科技期刊研究 2015(02)
    • [18].基于XML的电子试卷的结构模型设计[J]. 现代交际 2015(10)
    • [19].基于行为的结构化文档多级访问控制[J]. 计算机研究与发展 2013(07)
    • [20].XML信息检索技术综述[J]. 甘肃科技 2011(19)
    • [21].荣联云盘系统打造时尚办公新平台[J]. 软件和信息服务 2015(02)
    • [22].分布式环境下的文档相似度研究与实现[J]. 现代图书情报技术 2011(Z1)
    • [23].基于Lucene的PDF文档文本解析的实现[J]. 信息与电脑(理论版) 2009(16)
    • [24].非结构化文档全文检索技术研究及在协同办公系统中的应用[J]. 电子技术与软件工程 2018(09)
    • [25].一种面向领域文档的结构化检索模型及其在农技处方检索中的应用[J]. 计算机科学 2015(10)
    • [26].简单介绍可扩展标记语言XML[J]. 电脑知识与技术 2010(20)
    • [27].手势与手写文档中文本行的提取[J]. 计算机应用与软件 2008(06)
    • [28].自然语言处理技术在建筑工程中的应用研究综述[J]. 图学学报 2020(04)

    标签:;  ;  ;  ;  ;  

    基于语义Web技术的非结构化文档管理方法研究
    下载Doc文档

    猜你喜欢