一种基于文本节点的XML文档索引和查询方法

一种基于文本节点的XML文档索引和查询方法

论文摘要

XML作为一种扩展标记语言以其独有的特点及优势,使得开展Internet上的深层应用成为可能,它将逐步取代HTML,并成为Internet上数据表示及数据交换格式的新标准。如今,越来越多的数据被存储在XML文档中,在Internet上已经存储了大量的以XML文档为基础的数据集。如何存储和查询XML数据的数据库技术是一个重要的研究课题。由于XML文档中的数据有结构嵌套和模式信息不完整的特点,使得其结构非常复杂,对它的查询处理也比较困难,传统的基于树型结构的遍历查询技术已经不能满足XML文档复杂的处理要求。因此,如何快速准确地对XML文档集中的数据进行查询已经成为一个亟待解决的问题。 本文对XML文档的查询算法进行了研究,构造了一种针对XML这种半结构化文档的基于文本节点的索引及查询策略,并建立了相应的索引结构及算法,实现了对XML文档的高效查询。这种方法有下以优点:索引文件小,查询速度快,易于实现,而且适用于所有XML文档,包括没有DTD(文档类型定义)文件的XML文档。 本文的主要工作如下: 1) 阐述了XML的基本概念及其特性,并说明了对XML文档进行查询的理论基础。 2) 对国内外XML查询技术进行研究,分析现有查询技术的优缺点,找到其中影响查询效率的因素,并吸取其中的先进思想。 3) 引入唯一元素标识UID的思想,并且说明如何利用该思想为XML文档建立索引。 4) 根据半结构化数据的不规则、不完整的特点,构造了一种增强的基于文本节点的XML文档索引。该索引结构存储了由DOM技术生成的XML文档树中对查询有利的关键信息,有效地得用了XML半结构化的特征,可以加快XML查询的速度。这种索引结构的特点是索引文件规模较小,而且可以进行局部查找。根据此索引技术设计了一种合适的查询算法,并对关键算法进行了形式化描述。

论文目录

  • 第一章 引言
  • 1.1 XML简介
  • 1.2 XML文档实例
  • 1.3 XML特性
  • 1.4 XML的意义及主要研究方向
  • 1.5 XML查询的依据
  • 第二章 XML查询技术及算法
  • 2.1 XML查询语言分类
  • 2.2 XML查询语言特征
  • 2.3 XML查询方法
  • 2.4 索引在XML查询优化中的重要性
  • 2.5 XML索引类型
  • 第三章 文本节点索引技术
  • 3.1 唯一元素标识
  • 3.2 增强的唯一元素标识
  • 3.3 文本节点索引
  • 3.4 非文本节点索引
  • 3.5 索引文件
  • 第四章 利用文本节点索引进行检索
  • 4.1 计算节点的累加频率
  • 4.2 词频累加器
  • 4.3 计算关键词频率比重
  • 4.4 关键算法描述
  • 第五章 XML查询系统的实现
  • 5.1 XML查询系统
  • 5.2 XML查询系统的模块功能
  • 5.3 实验结果及系统性能分析
  • 第六章 结束语
  • 参考文献
  • 致谢
  • 附录
  • 承诺
  • 相关论文文献

    • [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
    • [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
    • [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
    • [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
    • [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
    • [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
    • [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
    • [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
    • [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
    • [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
    • [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
    • [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
    • [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
    • [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
    • [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
    • [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
    • [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
    • [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [20].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
    • [21].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
    • [22].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
    • [23].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
    • [24].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
    • [25].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
    • [26].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
    • [27].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
    • [28].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
    • [29].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)
    • [30].XML安全技术在高校教务管理系统的应用研究[J]. 河北农业大学学报(农林教育版) 2015(03)

    标签:;  ;  ;  ;  ;  

    一种基于文本节点的XML文档索引和查询方法
    下载Doc文档

    猜你喜欢