论文摘要
语义Web作为目前Web的一个延伸,其目标是使Web上的数据具有机器可识别的语义,论文作者基于课题组研究开发的语义原生XML数据库系统(简称SNAX系统),对其中的数据存储方法和相关技术进行研究。首先,论文作者简介了Tim Berners-Lee提出的语义Web的体系结构和SNAX,提出了论文的研究方向并介绍了研究内容。接着,论文作者分析了当前XML数据存储的研究现状,由于XML通用的数据表示能力、XML数据的半结构化性、XML文档是否有模式定义、XML文档/数据的两重性和多用途性、以及XML在不同应用领域的特定需求,使得XML存储问题至今难以找到一种通用的“最佳”解决方案。当前已有的XML存储方式大致可分为三类:(1)在文件系统中以文件方式存储XML:(2)在传统的数据库系统中存储XML;(3)开发XML专用库来存储XML。论文作者在充分研究的基础上给出了合适的存储方案。最后,论文作者提出了一种名为DOBI(DTD Orthogonal B+tree Index)的结构索引,该索引通过查找DTD信息及利用特殊的存储结构,能很好地解决结构化查询中最基本的祖先及后代连接问题,并高效地实现各种查询。经过理论和实际的查询效率分析,证明了所提出的DOBI可快速确立元素间关系,减少路径访问次数,节约I/O资源,有效地实现XML文档的结构连接,提高查询效率。