Print

SNAX系统中数据存储研究

论文摘要

语义Web作为目前Web的一个延伸,其目标是使Web上的数据具有机器可识别的语义,论文作者基于课题组研究开发的语义原生XML数据库系统(简称SNAX系统),对其中的数据存储方法和相关技术进行研究。首先,论文作者简介了Tim Berners-Lee提出的语义Web的体系结构和SNAX,提出了论文的研究方向并介绍了研究内容。接着,论文作者分析了当前XML数据存储的研究现状,由于XML通用的数据表示能力、XML数据的半结构化性、XML文档是否有模式定义、XML文档/数据的两重性和多用途性、以及XML在不同应用领域的特定需求,使得XML存储问题至今难以找到一种通用的“最佳”解决方案。当前已有的XML存储方式大致可分为三类:(1)在文件系统中以文件方式存储XML:(2)在传统的数据库系统中存储XML;(3)开发XML专用库来存储XML。论文作者在充分研究的基础上给出了合适的存储方案。最后,论文作者提出了一种名为DOBI(DTD Orthogonal B+tree Index)的结构索引,该索引通过查找DTD信息及利用特殊的存储结构,能很好地解决结构化查询中最基本的祖先及后代连接问题,并高效地实现各种查询。经过理论和实际的查询效率分析,证明了所提出的DOBI可快速确立元素间关系,减少路径访问次数,节约I/O资源,有效地实现XML文档的结构连接,提高查询效率。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究中的关键技术及现状
  • 1.2.1 XML简介
  • 1.2.2 国外本体相关研究简介
  • 1.2.3 国内本体相关研究简介
  • 1.2.4 XML存储技术及研究现状
  • 1.3 主要研究内容
  • 1.4 论文组织结构
  • 第二章 SNAX系统
  • 2.1 SNAX体系结构
  • 2.2 系统组成
  • 2.2.1 存取管理器的研究与开发
  • 2.2.2 映射集成器的研究与开发
  • 2.2.3 多功能查询器的研究与开发
  • 2.2.4 Web数据采集器的研究与开发
  • 2.3 小结
  • 第三章 XML数据存储研究
  • 3.1 前言
  • 3.2 相关的工作
  • 3.3 不同的存储策略
  • 3.3.1 边表法
  • 3.3.2 SM对象法
  • 3.3.3 B-树方法
  • 3.3.4 文件系统对象(FSO)方法
  • 3.4 性能研究
  • 3.4.1 实验
  • 3.4.2 讨论
  • 3.5 SNAX系统的存储策略
  • 3.6 小结
  • 第四章 基于文档类型描述约束的数据更新
  • 4.1 保持约束的更新系统
  • 4.2 XML更新语言
  • 4.2.1 插入操作
  • 4.2.2 删除操作
  • 4.3 基于 DOM的数据更新
  • 4.4 基于 DOBI的数据更新
  • 4.4.1 DOBI数据插入
  • 4.4.2 DOBI数据删除
  • 4.5 实验分析
  • 4.6 小结
  • 第五章 结论与展望
  • 5.1 本文开展的工作
  • 5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间主要的研究成果
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/4388c1d45e2c7701243cc610.html