XML文档关系存储技术之模式映射方法的研究

XML文档关系存储技术之模式映射方法的研究

论文摘要

近几年来,随着互联网的迅速发展,XML已经发展成为互联网上数据交换或浏览时数据的重要表示媒介,如何有效管理XML文档已经成为一个十分棘手的问题。数据库是目前最主要的数据存储方式,人们很自然地希望可以将XML格式的文档与数据库系统结合在一起使用。由于关系数据库系统在存储管理、查询优化、并行控制、事务管理等方面都较其他系统远为成熟和稳定,因而自然地成为研究的重点。可行的方法是采用关系数据库对XML数据进行存储和操作,将半结构化转化为结构化的数据,通过查询数据库来提取、综合和分析XML多样的数据,这样就能够利用相对成熟的关系数据库技术。另一方面,W3C组织于2001年5月正式推荐了XML Schema为XML的标准模式,XML Schema的格式与XML的格式完全相同,而且提供了更多的内建数据类型,并支持用户对数据类型的扩展,基本上满足了关系模式在数据描述上的需要。所以,人们可能会考虑到如果可以把某个XML Schema模式转换到关系数据库的模式,那么符合XML Schema限定的XML文档就能很容易地加入到被转换成的关系数据库模式中去了。正是基于上述考虑,本文在介绍XML语言及相关知识、XML存储技术的基础上,着重研究了如何将一个XML Schema转换成关系数据库模式。首先简单分析了XML Schema中主要组件的转换。研究了内置基础类型如何转换到关系数据库模型中。讨论了简单类型的元素是如何转换的:分别对原子类型、列表类型和联合类型的元素采用了不同地转换方法。在此基础上进一步讨论了对带有属性的元素的转换方法,并研究了复杂类型元素的内容模型的转换方法。接下来研究了二级组件的转换。着重讨论了模型组元素的转换,依次分析了sequence模型组、choice模型组和all模型组在转换时采用的方法。在转化过程中,目的是尽量保证XML Schema信息的完整性。

论文目录

  • 中文摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究的现状
  • 1.3 研究内容及创新点
  • 1.4 本文组织结构
  • 第二章 XML及其模式语言介绍
  • 2.1 XML简介
  • 2.2 XML模式语言简介
  • 2.2.1 DTD简介
  • 2.2.2 XML Schema简介
  • 第三章 XML存储技术
  • 3.1 文件存储
  • 3.2 XML原生数据库
  • 3.3 XML在面向对象数据库中的存储
  • 3.4 XML在关系数据库中的存储
  • 3.4.1 模型映射方法
  • 3.4.2 结构映射方法
  • 第四章 基于模式映射方法的 XML关系存储技术的研究
  • 4.1 将 XML Schema的一级组件转换成关系模式的研究
  • 4.1.1 XML Schema模式一级组件转换成关系模式的一般方法
  • 4.1.2 简单类型元素的转换方法的研究
  • 4.1.2.1 内置简单类型的转换方法
  • 4.1.2.2 限制简单类型元素的转换方法
  • 4.1.2.3 列表类型元素的转换方法
  • 4.1.2.4 联合类型元素的转换方法
  • 4.1.2.5 小结
  • 4.1.3 具有属性的元素的转换方法的研究
  • 4.1.4 复杂类型元素的内容类型的转换方法的研究
  • 4.1.4.1 由简单类型衍生的复杂类型
  • 4.1.4.2 混合内容
  • 4.1.4.3 空内容
  • 4.1.4.4 AnyType
  • 4.2 XML Schema中的二级组件转换到 RDB模式的方法研究
  • 4.2.1 带有属性组的元素转换方法的研究
  • 4.2.2 带有模型组的元素转换方法的研究
  • 4.2.2.1 带有 sequence模型组的元素的转换方法
  • 4.2.2.2 带有 choice模型组的元素的转换方法
  • 4.2.2.3 带有all模型组的元素的转换方法
  • 4.2.2.4 小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 读硕士研究生期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    XML文档关系存储技术之模式映射方法的研究
    下载Doc文档

    猜你喜欢