XML数据查询的关键技术研究

XML数据查询的关键技术研究

论文摘要

XML的全称是Extensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式,并逐渐成为当前网络应用中事实的数据表达、交换的标准。鉴于XML在诸多领域有广泛的应用前景,许多关于XML的研究都是前沿和热点课题。例如在数据库领域,从某种意义上说XML作为数据库使用可以自然地表示嵌套型数据,比关系型数据库具有更强的表达能力,但是对XML数据的查询还有很多不完善的地方,其查询准确性与查询速度都需进一步的提高。XML数据管理系统主要解决XML数据的存储管理、查询处理、访问控制、数据更新等。XML查询处理与优化包括XML查询代数、查询处理、查询优化等。XML数据查询是XML数据管理一个非常重要的组成部分,是当前学术界研究的一个热点方向。XML查询根据其查询模式的不同可以分为两类:XML Query查询方式和XML IR查询方式。而XML IR方式又可以细分为三类:XML IR/keyword方式、XML IR/query方式和XML IR/fragment方式。本文主要研究XML数据集成查询过程中碰到的一些问题,以及所采取的相应解决方案。其中主要包括三部分的内容:第一,由于XPath是当前流行的XML数据查询语言XQuery和XSLT的基础,我们针对XPath语言中的复杂路径表达式,设计了一种路径表达式的最优化方法,用以提高在对XML进行查询时的执行效率;第二,基于当前比较流行的一种查询代数OrientXA,基于代数表达等价原则,设计了一系列的等价转化方法,简化了XML查询路径表达式的代数表示,优化了XML数据的查询效率;第三,针对多XML数据源的集成查询,由于查询过程往往涉及到对多个XML片段中相似重复信息的处理,而我们有时候需要对多XML片段中的共同信息进行提取,由此,本文提出一种XML有向标记树模型,并在此模型上设计了一种相似匹配算法来对共同信息进行挖掘。实验显示,该算法具有很高的可行性及使用价值。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 预备知识
  • 1.2 国内外研究现状
  • 1.3 本文的主要贡献
  • 1.3.1 XPath路径表达式的优化
  • 1.3.2 基于OrientXA的XML代数优化
  • 1.3.3 多XML文档片段的相似性度量方法
  • 1.4 本文的组织结构
  • 第二章 XPATH路径表达式的最优化方法
  • 2.1 背景与相关概念
  • 2.2 MINPATH理论基础
  • 2.3 MINPATH结构创建方法
  • 2.3.1 元素关系表的建立
  • 2.3.2 XTree的生成
  • 2.3.3 XGraph的建立
  • 2.4 M/NPATH优化处理方法
  • 2.4.1 路径表达式的分解
  • 2.4.2 路径表达式的重构
  • 2.5 实验结果及分析
  • 2.6 相关研究工作
  • 本章小结
  • 第三章 XML查询代数与查询优化方法
  • 3.1 背景与相关介绍
  • 3.2 XML查询代数ORIENTXA
  • 3.2.1 OrientXA的基本特点
  • 3.2.2 关键的代数操作符
  • 3.2.3 查询代数表示方法
  • 3.3 XML查询优化方法
  • 3.3.1 基于等价变换的查询优化
  • 3.3.2 复杂路径的最小分解算法
  • 3.4 最小分解算法复杂性分析
  • 3.5 相关研究工作
  • 本章小结
  • 第四章 多XML文档片段相似性度量方法
  • 4.1 背景及相关介绍
  • 4.2 文档片段多标签有向树模型
  • 4.3 相似度度量方法
  • 4.3.1 结点标记分析
  • 4.3.2 边标记分析
  • 4.4 XML匹配算法设计
  • 4.4.1 粗糙结果集计算
  • 4.4.2 边优化方法实现
  • 4.5 实验效果分析
  • 本章小结
  • 第五章 结束语
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 在读期间参与科研项目情况
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].处理XML路径表达式查询的高效方法研究[J]. 延边教育学院学报 2017(04)
    • [2].基于SAM方法的针对路径表达式中“//”操作符计算的有效解决方案[J]. 贵阳学院学报(自然科学版) 2017(02)
    • [3].基于自动机XML正则路径表达式查询研究[J]. 计算机应用 2010(09)
    • [4].基于模式的XML路径表达式查询处理技术[J]. 计算机应用 2009(11)
    • [5].基于匹配的最小化路径表达式的优化方法[J]. 计算机工程与设计 2008(09)
    • [6].XML上的安全敏感信息控制研究[J]. 计算机工程与设计 2009(01)
    • [7].XML文档访问控制中互斥操作研究[J]. 计算机工程与设计 2008(23)
    • [8].LCA关系序对导引小枝查询[J]. 小型微型计算机系统 2010(03)
    • [9].改进XISS索引技术的仿真研究[J]. 计算机科学 2012(01)
    • [10].IPI:灵活高效的对象代理数据库索引结构[J]. 计算机科学与探索 2018(08)
    • [11].XML树模式查询的描述语言及形式语义[J]. 计算机科学与探索 2013(05)
    • [12].基于XML的数据查询效率优化方法的研究[J]. 计算机工程与设计 2008(11)
    • [13].基于视图的XML重写技术的研究综述[J]. 微计算机应用 2009(12)
    • [14].高效查询的XML编码方案[J]. 计算机应用 2010(03)
    • [15].一种支持对象代理数据库高效查询处理的索引结构[J]. 计算机学报 2010(08)
    • [16].基于插件的SPSS程序化计算的设计和实现[J]. 电脑与信息技术 2008(04)
    • [17].XML的结构完整性约束推理[J]. 计算机学报 2010(12)
    • [18].基于XML技术的WEB信息收集方法研究[J]. 电子技术与软件工程 2015(03)
    • [19].XML约束的规范化研究[J]. 科技广场 2008(03)
    • [20].BBS详细信息半自动定位技术研究[J]. 警察技术 2011(01)
    • [21].基于依赖树的XML数据查询优化与处理方法研究[J]. 煤炭技术 2011(02)
    • [22].一种新的基于编码的XML结构连接算法[J]. 山东科技大学学报(自然科学版) 2009(02)
    • [23].基于Schema的XML混合编码索引查询技术[J]. 计算机应用与软件 2016(02)
    • [24].基于模式的XML查询重写研究[J]. 中国科技信息 2009(12)
    • [25].XML数据索引技术研究[J]. 电脑与电信 2009(06)
    • [26].一种对象代理数据库的跨类查询优化方法[J]. 计算机工程与科学 2016(07)
    • [27].基于路径表达式的XML索引查询技术[J]. 计算机工程与设计 2011(03)
    • [28].一种XML数据库上谓词“Contain”的实现方法[J]. 计算机应用与软件 2009(04)

    标签:;  ;  ;  

    XML数据查询的关键技术研究
    下载Doc文档

    猜你喜欢