论文题目: XML数据的查询、转换和集成
论文类型: 博士论文
论文专业: 计算机软件与理论
作者: 郭志懋
导师: 周傲英
关键词: 查询处理,查询语言,转换,服务集成
文献来源: 复旦大学
发表年度: 2005
论文摘要: XML是Internet上最优秀的数据交换格式之一。近年来,学术界和工业界对XML数据处理投入了很大的热情。为了有效地组织和管理XML数据,研究人员提出了不同的解决办法。其中,人们较多地采用关系数据库或者文件系统来管理XML数据。随着Web服务的发展,越来越多的远端Web服务也开始提供XML数据。所以,在应用中存在着多种XML数据源。 虽然学术界已经在XML数据的查询处理和转换方面取得了不少研究成果,但是仍然存在着许多有待研究与解决的问题。本文探讨不同XML数据源的查询、转换和集成的问题,包括关系数据库中的XML查询处理,特别是通过创建路径索引来优化查询执行;结果类型保证的XML文档的查询和转换;无需中间结果缓存的XML数据转换;集成多个Web服务返回的XML数据等。本文的主要贡献如下: ·研究了关系数据库中的XML数据的查询优化技术。提出了一个代价模型,该模型考虑到了源XML数据的统计信息和具体应用的特点,可以较好地估计索引的空间占用量和它们对查询性能的改善程度;采用贪心算法来选择性地创建一部分较好的映射索引;实验表明,相对于没有创建索引的情况,选择创建的索引仅仅额外占用了有限的的磁盘空间,但是它们对查询性能的改善是非常明显的。 ·研究了文件系统中的XML文件的查询处理技术。利用XML查询扩充属性文法,构造出一种新的XML查询语言XTG。采用XTG语言,能够从一定程度上保证结果文档的正确性,即,它们必定符合预先规定的DTD结构。提出了XTG查询的概念执行计划,并且讨论了几种优化策略,比如图规约技术等。实验结果表明这些优化策略是有效的。 ·提出了XML转换语言G2ST,它可以将GML文档转换得到SVG文档。G2ST也是属性文法的扩展,其中的语义计算规则是XSLT模板。采用G2ST语言不仅可以减轻用户创建有效转换时的负担,而且保证转换结果是有效的SVG文档。实验证实G2ST是一种转换GML数据的有效方法。
论文目录:
摘要
ABSTRACT
第一章 前言
1.1 研究背景
1.1.1 关系数据库与XML数据
1.1.2 属性文法与XML文档的查询和转换语言
1.1.3 XML数据流的过滤与查询
1.1.4 Web服务
1.2 本文的研究内容
1.2.1 通过索引优化关系数据库中的XML查询处理
1.2.2 以属性文法查询或转换XML文档
1.2.3 可扩展的XML数据转换
1.2.4 集成Web服务
1.3 本文组织
第二章 基于XML路径索引选择的查询优化技术
2.1 关系数据库与XML
2.2 结构映射索引
2.3 代价模型
2.4 搜索策略
2.5 性能分析
2.6 小结
第三章 类型保证的XML文档的查询处理
3.1 概述
3.2 XTG及其概念计算过程
3.2.1 XML查询语言XTG
3.2.2 XTG的概念计算过程
3.3 优化XTG的查询执行
3.3.1 缓存中间结果
3.3.2 图归约优化技术
3.3.3 路径扩展
3.4 原型系统与实验性能分析
3.4.1 原型系统
3.4.2 图归约和路径扩展的实验对比
3.5 小结
第四章 类型保证的XML文档的转换
4.1 概述
4.2 背景知识介绍
4.2.1 地理信息标记语言GML
4.2.2 可伸缩向量图形格式SVG
4.2.3 可扩展样式转换语言XSLT
4.3 转换语言G2ST
4.4 G2ST的计算
4.4.1 直接计算策略
4.4.2 全部规则合并策略
4.4.3 部分规则合并策略
4.5 原型系统
4.6 相关工作
4.7 小结
第五章 可扩展的XML数据的转换
5.1 概述
5.2 背景知识介绍
5.2.1 简单DTD
5.2.2 核心XML转换语言
5.2.3 XML的简单应用接口SAX
5.3 转换树
5.3.1 XSLT_(core)
5.3.2 转换树
5.4 XSLT转换的流处理方式
5.4.1 流处理模型
5.4.2 构建流处理模型的算法
5.5 实验结果分析
5.6 相关工作
5.7 小结
第六章 用XML查询语言集成Web服务
6.1 概述
6.2 Web服务
6.3 WSQuery:Web服务集成语言
6.3.1 WSQuery树
6.3.2 概念计算策略
6.3.3 代价估计
6.4 依赖分析
6.5 WSQuery程序的并行执行
6.6 小结
第七章 总结
参考文献
发表论文
致谢
论文独创性声明
论文使用授权声明
发布时间: 2005-09-19
参考文献
- [1].关于计算机理解自然查询语言的研究[D]. 郑逢斌.西南交通大学2004
- [2].多媒体查询语言及其查询处理方法研究[D]. 吴宗大.华中科技大学2009
- [3].自然空间查询语言解译机制研究[D]. 李滨.解放军信息工程大学2009
- [4].基于GIS平台的空间查询语言与空间数据挖掘研究[D]. 徐承志.武汉大学2010
- [5].自治异构数据源的集成查询处理[D]. 李效东.中国科学院研究生院(软件研究所)2002