非结构化信息的Native XML文档存储机制研究

非结构化信息的Native XML文档存储机制研究

论文摘要

随着Internet/Intranet技术日新月异的发展,网上数据交换量日益增大,人们所处理的数据种类已不再局限于传统的结构化数据,而是涉及到了诸如电子邮件、电子图书、图像和视频/声频对象等非结构化数据。如何采用统一的方法表示和访问这些非结构化信息是各组织机构实施信息化建设的核心,也是目前一个新兴的研究方向。XML作为数据表示和交换的新标准,具有统一的非结构化信息描述机制。但传统数据库系统对XML的支持在对其逻辑结构和数据完整性存储方面存在不足,限制了以XML所表示的非结构化信息的表达、交换和共享。Native XML数据库为XML文档定义了一个(逻辑)模型进行存取操作,具有与底层的物理存储模型无关的特性。利用Native XML数据库可以为采用XML所表示的非结构化信息提供真正有效的存储和信息获取能力。本文提出了一套较为通用的非结构化信息的Native XML文档存储访问策略和实现方案作为对非结构化信息存取机制研究的探索和尝试,主要包括下列理论及技术:1.基于子树和基于文档的存储模式相结合,以最大程度保证底层各类形式异构和内容混杂的数据存取的有效性和完整性;2.动态分枝合成技术和数据映像机制的引入,实现对XML文档的有效支持,并在一定程度上提高系统处理性能;3.结合XQuery查询语言特点,提出一种新型XML数据操作语言XQUL,支持XML数据的查询以及更新操作;4.三种索引(文档索引、结构索引、值索引)的建立,为XML数据提供从站点到文档,从文档到元素的多级访问策略。最后,笔者在参与湖北省教育厅科研资助项目——“基于XML的WEB存储系统研究”的开发过程中,以上述技术理论为指导,结合JAVA及XML相关技术,初步实现了本文所提出的DBNS (Dynamic Branching and Mapping Mechanism for Native XML Storage)系统模型。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 本文选题的研究背景
  • 1.1.1 非结构化信息概述
  • 1.1.2 非结构化信息存储技术
  • 1.2 文献综述
  • 1.2.1 研究现状
  • 1.2.2 未来发展方向
  • 1.3 本文所做的工作
  • 1.3.1 课题来源及意义
  • 1.3.2 本文所做的工作
  • 第二章 XML 与非结构化信息
  • 2.1 非结构化信息的特征
  • 2.2 XML 技术及相关应用
  • 2.2.1 什么是XML
  • 2.2.2 XML 产生背景
  • 2.2.3 XML 核心技术分析
  • 2.2.3.1 XML 语法格式
  • 2.2.3.2 合法性检查
  • 2.2.3.3 XML 数据处理
  • 2.2.3.4 XML 文档显示
  • 2.2.4 XML 的应用范围
  • 2.3 XML 与非结构化信息的表示和集成
  • 第三章 Native XML 文档存储技术
  • 3.1 XML 的主要存储技术
  • 3.1.1 文件系统存储
  • 3.1.2 传统数据库存储
  • 3.1.3 Native XML 数据库存储
  • 3.2 Native XML 存储技术相关概念
  • 3.2.1 定义
  • 3.2.2 存储分类
  • 3.2.3 NXD 与EXD
  • 3.2.5 Native XML 存储的优点
  • 第四章 DBNS 的相关技术
  • 4.1 信息访问语言
  • 4.1.1 XPath、XQuery 技术分析
  • 4.1.2 XQUL 技术分析
  • 4.1.2.1 XQUL 文法
  • 4.1.2.2 FLWOR 表达式
  • 4.1.2.3 FLWUR 表达式
  • 4.2 索引技术
  • 4.2.1 XML 文档查询索引技术分析
  • 4.2.2 B 树
  • 4.2.2.1 B 树的定义
  • 4.2.2.2 B 树的结点类型
  • 4.2.2.3 查找
  • 4.2.2.4 插入和生成
  • 4.2.3 DBNS 索引机制
  • 第五章 DBNS 系统设计及实现
  • 5.1 DBNS 体系结构
  • 5.2 DBNS 存储模块
  • 5.2.1 源数据层
  • 5.2.2 中间数据层
  • 5.2.2.1 文档转换
  • 5.2.2.2 数据模型
  • 5.2.3 存储管理层
  • 5.2.3.1 动态分枝
  • 5.2.3.2 数据映像机制
  • 5.2.3.3 共享
  • 5.2.3.4 动态合成及碎片整理
  • 5.2.4 应用层
  • 5.3 运行界面
  • 5.4 结果检验
  • 结束语
  • 参考文献
  • 攻读硕士学位期间发表的论文和参加的主要科研项目
  • 致谢
  • 中文详细摘要
  • 相关论文文献

    标签:;  ;  

    非结构化信息的Native XML文档存储机制研究
    下载Doc文档

    猜你喜欢