SNAX系统中数据存储研究

论文摘要

语义Web作为目前Web的一个延伸，其目标是使Web上的数据具有机器可识别的语义，论文作者基于课题组研究开发的语义原生XML数据库系统（简称SNAX系统），对其中的数据存储方法和相关技术进行研究。首先，论文作者简介了Tim Berners-Lee提出的语义Web的体系结构和SNAX，提出了论文的研究方向并介绍了研究内容。接着，论文作者分析了当前XML数据存储的研究现状，由于XML通用的数据表示能力、XML数据的半结构化性、XML文档是否有模式定义、XML文档／数据的两重性和多用途性、以及XML在不同应用领域的特定需求，使得XML存储问题至今难以找到一种通用的“最佳”解决方案。当前已有的XML存储方式大致可分为三类：（1）在文件系统中以文件方式存储XML：（2）在传统的数据库系统中存储XML；（3）开发XML专用库来存储XML。论文作者在充分研究的基础上给出了合适的存储方案。最后，论文作者提出了一种名为DOBI（DTD Orthogonal B+tree Index）的结构索引，该索引通过查找DTD信息及利用特殊的存储结构，能很好地解决结构化查询中最基本的祖先及后代连接问题，并高效地实现各种查询。经过理论和实际的查询效率分析，证明了所提出的DOBI可快速确立元素间关系，减少路径访问次数，节约I／O资源，有效地实现XML文档的结构连接，提高查询效率。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 研究背景

1.2 研究中的关键技术及现状

1.2.1 XML简介

1.2.2 国外本体相关研究简介

1.2.3 国内本体相关研究简介

1.2.4 XML存储技术及研究现状

1.3 主要研究内容

1.4 论文组织结构

第二章 SNAX系统

2.1 SNAX体系结构

2.2 系统组成

2.2.1 存取管理器的研究与开发

2.2.2 映射集成器的研究与开发

2.2.3 多功能查询器的研究与开发

2.2.4 Web数据采集器的研究与开发

2.3 小结

第三章 XML数据存储研究

3.1 前言

3.2 相关的工作

3.3 不同的存储策略

3.3.1 边表法

3.3.2 SM对象法

3.3.3 B-树方法

3.3.4 文件系统对象（FSO）方法

3.4 性能研究

3.4.1 实验

3.4.2 讨论

3.5 SNAX系统的存储策略

3.6 小结

第四章基于文档类型描述约束的数据更新

4.1 保持约束的更新系统

4.2 XML更新语言

4.2.1 插入操作

4.2.2 删除操作

4.3 基于 DOM的数据更新

4.4 基于 DOBI的数据更新

4.4.1 DOBI数据插入

4.4.2 DOBI数据删除

4.5 实验分析

4.6 小结

第五章结论与展望

5.1 本文开展的工作

5.2 展望

参考文献

致谢

攻读学位期间主要的研究成果

SNAX系统中数据存储研究

论文摘要

论文目录

相关论文文献