基于本体的XML近似查询方法研究

基于本体的XML近似查询方法研究

论文摘要

随着XML文档蕴含信息量的逐渐增加,基于大量异构XML文档的查询系统很难提供给用户最为相关的查询结果,从而导致查询结果的查准率和查全率都不能令人满意,可能会出现极端的情况:将不符合用户查询意图的数据包含到查询结果集合中,导致查询结果过多,有效信息湮没其中;没有检索到应该纳入符合要求的数据,查询结果信息过少;错误理解了用户查询的侧重点,结果与用户预期有较大偏差,导致查询无效。出现“空结果”问题的原因主要分为以下几个方面:查询路径和XML文档内部数据的组织结构的不匹配;查询路径中节点元素的命名和XML文档中节点的命名规则的不同;查询条件过紧,从而导致满足条件的数据过少;由于用户对XML文档领域知识没有共同的理解,导致符合用户查询倾向的信息无法反馈给用户。解决空结果的方法很多,引入领域本体知识是其中之一。为了解决因对语义扩展到因素考虑不足而产生空结果的问题,引入领域本体知识来表示语义,利用本体聚类和本体映射的方法,实现查询的扩展。要实现明确的语义,需要两类语义数据的支持:描述一个专业领域知识,提供共享词汇支持的本体;包含明确语义信息的文档实例,即本体描述的本体实例。从XML文档中抽取隐含语义信息,构建描述XML文档的形式化语义描述的本体,即可以将XML描述的信息从语法层提升到语义层。基于上述需求,本文提出基于本体的XML近似查询。整个方法主要分成三部分:首先,通过对XML的解析,将文档中的元素、属性以及值等分离出来,提取各种概念以及概念之间的关系,映射为本体的概念、属性和关系,构建标准的领域本体中,全面的体现XML文档中的语义信息。其次,针对不同方法所构建多个异构的冲突的本体,通过基于相似度计算的本体映射,进行查询条件的语义扩展;然后对XML查询的结构和条件进行扩展,在条件松弛处理的过程中,首先将条件拆分成多个元素,依重要程度选取用于松弛的元素,到本体中进行基于语义相似度的查询松弛,最后基于相关度来选取松弛后的结果。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 课题意义
  • 1.3 研究现状
  • 1.3.1 XML的近似查询处理
  • 1.3.2 基于本体的查询松弛
  • 1.4 本文研究工作
  • 1.5 本文组织结构
  • 第2章 基础知识
  • 2.1 XML相关技术
  • 2.1.1 XML文档结构
  • 2.1.2 XQuery查询语言
  • 2.1.3 XML近似查询技术
  • 2.2 XML文档中的语义信息
  • 2.2.1 XML文档中的语义信息
  • 2.2.2 XML信息抽取和本体的映射规则
  • 2.3 本体相关技术
  • 2.3.1 本体的定义
  • 2.3.2 本体的分类及关系
  • 2.3.3 本体的构建方法
  • 2.3.4 本体映射的基本方法
  • 2.3.5 基于语义度量的本体映射
  • 第3章 基于本体的查询预处理
  • 3.1 本体构建
  • 3.1.1 系统框架
  • 3.1.2 方法描述
  • 3.2 本体相似度和本体语义树
  • 3.2.1 本体的相似度计算
  • 3.2.2 本体语义树的建立
  • 3.3 基于本体的语义扩展
  • 3.3.1 冲突检测规则
  • 3.3.2 语义扩展规则
  • 3.3.3 基于本体的语义松弛算法
  • 3.4 本章小结
  • 第4章 基于本体的XML近似查询
  • 4.1 查询的结构扩展
  • 4.1.1 结构松弛的原理
  • 4.1.2 结构相似度的计算方法
  • 4.2 基于本体的查询条件扩展
  • 4.2.1 基于语义距离的本体条件扩展原理
  • 4.2.2 查询条件松弛算法
  • 4.3 基于本体的近似查询算法
  • 4.4 本章小结
  • 第5章 设计与测试
  • 5.1 系统结构
  • 5.1.1 本体导入解析
  • 5.1.2 XML文档解析
  • 5.1.3 领域本体语义标注XML元数据
  • 5.1.4 XML信息抽取和本体映射
  • 5.2 实验测试
  • 5.2.1 测试平台及实验数据
  • 5.2.2 测试查询及测试参数介绍
  • 5.2.3 基于本体的查询松弛整合算法测试
  • 5.3 本章小结
  • 第6章 总结与展望
  • 6.1 工作总结
  • 6.2 工作展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
    • [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
    • [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
    • [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
    • [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
    • [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
    • [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
    • [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
    • [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
    • [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
    • [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
    • [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
    • [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
    • [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
    • [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
    • [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
    • [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
    • [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [20].《XML技术》线上教学的实践和探索[J]. 科技风 2020(33)
    • [21].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
    • [22].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
    • [23].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
    • [24].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
    • [25].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
    • [26].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
    • [27].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
    • [28].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
    • [29].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
    • [30].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)

    标签:;  ;  ;  

    基于本体的XML近似查询方法研究
    下载Doc文档

    猜你喜欢