论文摘要
XML是W3C于1998年提出的一种标记语言,由于独特的技术优势,XML推出后很快就成为Internet上信息描述和交换的标准。随着XML应用的越来越广泛,Web上的XML文档与日俱增,为了实现对海量XML数据的高效存储与访问,基于数据库技术的XML查询优化已成为一个十分重要的研究课题。论文首先分析了XML数据库的发展现状,接着介绍了XML Schema等XML的相关概念;为了有效地支持XML查询优化,对XML数据的几种编码方法和关系存储模型以及查询优化的几种方式做了一些探究。本文主要是对基于关系数据库的XML查询优化技术进行研究,所做的主要工作包括:(1)基于区间编码和XRel关系存储模型的基础上,提出了扩展的关系存储模型,该模型可以高效地实现结构连接中包含关系与位置关系的计算。(2)提出了一种基于XML模式信息的路径表达式的优化方法,其实现步骤包括:模式信息的提取、判断结点是否可优化以及优化算法描述,当路径表达式较长时,这种方法能够很好的减少路径表达式的连接操作次数,从而实现路径的优化。(3)由于XML文档的查询通常被转化为两个结点之间的包含关系或文档位置关系的计算,因此有效地支持结构连接对XML查询的实现意义重大。文章对结构连接算法进行了研究和改进,基于扩展的关系存储模型实现了更为有效地包含关系的结构连接算法。改进的算法能够避免对内表的重复扫描,在对双亲/孩子关系的结构连接操作时,CPU时间和I/O复杂度比原算法要低得多,特别是当双亲结点的队列中存在嵌套结点时,改进后的算法更优越。
论文目录
摘要Abstract第1章 引言1.1 研究背景1.2 XML数据库系统的现状1.3 本文主要研究内容1.4 论文的组织结构第2章 XML及其查询语言2.1 XML概述2.2 与XML有关的基本概念2.2.1 XML DTD2.2.2 XML Schema2.2.3 DOM与SAX2.3 XML查询语言2.3.1 LOREL查询语言2.3.2 XML-QL查询语言2.3.3 XPath查询语言2.3.4 XQuery查询语言2.4 本章小结第3章 对XML编码及关系存储的研究3.1 XML编码3.1.1 区间编码3.1.2 前缀编码3.1.3 k分树编码3.1.4 支持动态更新的编码3.2 XML数据的关系存储3.2.1 模型映射方法3.2.2 存储粒度问题3.3 本章小结第4章 XML查询优化4.1 XML查询优化与关系数据库查询优化的关系4.2 XML查询优化的方式4.2.1 编码机制4.2.2 路径优化4.2.3 索引优化4.3 基于模式的路径表达式优化4.3.1 模式信息提取4.3.2 路径表达式的优化4.4 本章小结第5章 结构连接算法的研究与改进5.1 研究现状5.2 对存储模型的改进5.3 对包含关系的结构连接算法的改进5.3.1 一种处理包含关系结构连接的算法5.3.2 改进的包含关系结构连接的算法5.4 算法分析5.5 本章小结第6章 总结与展望6.1 论文总结6.2 未来工作致谢参考文献攻读硕士期间发表的论文和参加的项目
相关论文文献
标签:查询优化论文; 关系数据库论文; 结构连接算法论文;