论文摘要
随着Internet/Intranet技术日新月异的发展,网上数据交换量日益增大,人们所处理的数据种类已不再局限于传统的结构化数据,而是涉及到了诸如电子邮件、电子图书、图像和视频/声频对象等非结构化数据。如何采用统一的方法表示和访问这些非结构化信息是各组织机构实施信息化建设的核心,也是目前一个新兴的研究方向。XML作为数据表示和交换的新标准,具有统一的非结构化信息描述机制。但传统数据库系统对XML的支持在对其逻辑结构和数据完整性存储方面存在不足,限制了以XML所表示的非结构化信息的表达、交换和共享。Native XML数据库为XML文档定义了一个(逻辑)模型进行存取操作,具有与底层的物理存储模型无关的特性。利用Native XML数据库可以为采用XML所表示的非结构化信息提供真正有效的存储和信息获取能力。本文提出了一套较为通用的非结构化信息的Native XML文档存储访问策略和实现方案作为对非结构化信息存取机制研究的探索和尝试,主要包括下列理论及技术:1.基于子树和基于文档的存储模式相结合,以最大程度保证底层各类形式异构和内容混杂的数据存取的有效性和完整性;2.动态分枝合成技术和数据映像机制的引入,实现对XML文档的有效支持,并在一定程度上提高系统处理性能;3.结合XQuery查询语言特点,提出一种新型XML数据操作语言XQUL,支持XML数据的查询以及更新操作;4.三种索引(文档索引、结构索引、值索引)的建立,为XML数据提供从站点到文档,从文档到元素的多级访问策略。最后,笔者在参与湖北省教育厅科研资助项目——“基于XML的WEB存储系统研究”的开发过程中,以上述技术理论为指导,结合JAVA及XML相关技术,初步实现了本文所提出的DBNS (Dynamic Branching and Mapping Mechanism for Native XML Storage)系统模型。
论文目录
摘要Abstract第一章 绪论1.1 本文选题的研究背景1.1.1 非结构化信息概述1.1.2 非结构化信息存储技术1.2 文献综述1.2.1 研究现状1.2.2 未来发展方向1.3 本文所做的工作1.3.1 课题来源及意义1.3.2 本文所做的工作第二章 XML 与非结构化信息2.1 非结构化信息的特征2.2 XML 技术及相关应用2.2.1 什么是XML2.2.2 XML 产生背景2.2.3 XML 核心技术分析2.2.3.1 XML 语法格式2.2.3.2 合法性检查2.2.3.3 XML 数据处理2.2.3.4 XML 文档显示2.2.4 XML 的应用范围2.3 XML 与非结构化信息的表示和集成第三章 Native XML 文档存储技术3.1 XML 的主要存储技术3.1.1 文件系统存储3.1.2 传统数据库存储3.1.3 Native XML 数据库存储3.2 Native XML 存储技术相关概念3.2.1 定义3.2.2 存储分类3.2.3 NXD 与EXD3.2.5 Native XML 存储的优点第四章 DBNS 的相关技术4.1 信息访问语言4.1.1 XPath、XQuery 技术分析4.1.2 XQUL 技术分析4.1.2.1 XQUL 文法4.1.2.2 FLWOR 表达式4.1.2.3 FLWUR 表达式4.2 索引技术4.2.1 XML 文档查询索引技术分析4.2.2 B 树4.2.2.1 B 树的定义4.2.2.2 B 树的结点类型4.2.2.3 查找4.2.2.4 插入和生成4.2.3 DBNS 索引机制第五章 DBNS 系统设计及实现5.1 DBNS 体系结构5.2 DBNS 存储模块5.2.1 源数据层5.2.2 中间数据层5.2.2.1 文档转换5.2.2.2 数据模型5.2.3 存储管理层5.2.3.1 动态分枝5.2.3.2 数据映像机制5.2.3.3 共享5.2.3.4 动态合成及碎片整理5.2.4 应用层5.3 运行界面5.4 结果检验结束语参考文献攻读硕士学位期间发表的论文和参加的主要科研项目致谢中文详细摘要
相关论文文献
标签:非结构化信息论文; 数据库论文;
非结构化信息的Native XML文档存储机制研究
下载Doc文档