论文摘要
近年来,随着计算机技术的迅猛发展和网络技术的不断进步,人们通过网络来传输各种数据也越来越频繁。但是在不同环境下,人们使用不同的数据表达方式,这就给数据的传输造成了极大的不便。而XML作为一种数据的表现形式,正在成为事实上的数据标准。XML的应用普及,也使得对XML的各种研究已经成为当前数据库研究领域的一个热点。对于XML的研究大多集中在两个方面:存储和查询。目前针对这两个方面的研究工作已经有很多,但是针对特殊类别的XML文档的研究却不是很多。本文中主要提到的Temporal XML文档就是其中的一个例子。当前针对这种特殊的XML文档的研究大多还是停留在对于普通XML文档研究的基础之上,即对于Temporal XML文档的各种操作仍然使用普通XML文档的操作模式进行操作,这就大大的影响了对于Temporal XML文档各种操作的执行效率。本文提出了一种关于XML文档的存储模型,这种模型是一种典型的NXD(Native XML DBMS)的存储模式,它采用了元素和字符数据进行分离的思想,构造的元素架构是以数据块为单位结点的一种树结构,字符数据则以聚簇方式存放。在这种存储结构上,可以更好的对XML文档数据进行各种操作。针对Temporal XML文档这种特殊的XML文档,本文提出了一种新的Temporal XML的数据模型。XPath数据模型是传统XML文档的一种数据模型,在这种数据模型的基础上,我们加入了时序的概念,从而得到了可以适用于Temporal XML文档的数据模型。本文在上面提出的数据模型的基础上,针对Temporal XML文档这一特殊的XML文档,提出了一种特殊的索引结构。这种索引结构将文档中的元素结点抽出,并组成一个有向无环图(DAG)的结构。其他的元素数据放到各个索引表中,并存储与二级存储器内。在整个索引结构中,本文还考虑到Temporal XML文档与普通XML文档的不同之处,即在Temporal XML文档中的时间片属性。我们在索引表中放入时间片的属性,使我们在操作这种特殊的XML文档时,摆脱利用传统的XML文档操作模式来操作Temporal XML文档的方法,提出了专门针对Temporal XML文档的索引结构,大大的提高了效率。在提出这种索引结构的基础上,本文还进一步给出了利用该索引结构对数据进行查询、插入和删除等操作的算法。