论文摘要
随着网络和信息技术的发展,XML(Extensible Markup Language)已逐步成为互联网上数据表示和数据交换的一种新的标准。可以预见,将来XML会成为Web信息交换的统一标准。通常,随着时间推移,我们会对XML文档进行一些修改。之后,我们希望快速对文档历史信息进行查询。在这样的应用背景下,如何在XML文档中表达时间相关的数据,跟踪历史信息,和恢复文档在以前任意时刻的状态的研究中受到越来越多的关注。对XML(包括时态XML和非时态XML)数据建立有效的索引,是左右XML数据处理性能的重要因素。在非时态XML索引研究领域,研究成果较多,索引总体上可以分为节点记录类索引和结构摘要类索引。而时态XML索引的研究才刚刚开始。虽然一些文献提出模型和索引算法,但大多基于对版本信息的维护,尤其对于版本间数据查询处理效率较低。同时,由于时态XML文档中包含时间信息,文档更新较为复杂,这就对索引更新提出了更高的要求。重新建立索引结构,重新对节点编码将严重影响索引的效率。本文针对时态XML文档特点,提出一种新的时态XML索引方案,TF&B索引。从索引结构、查询算法和更新维护算法三个方面对该索引进行介绍。本文的主要工作在于:1.论文对TF&B索引的结构进行详细介绍,给出了构建算法。2.论文根据时态XML查询表达式的特点,将其分为四大类进行算法研究,最后给出查询比较的实验数据。通过分析比较,证明了该索引具有较好的性能。3.论文从时态XML文档片段增加、删除和更新方面,对TF&B索引的更新算法进行讨论。本文工作的意义是给出了有效索引时态XML文档的一套完整方案,具体体现在以下方面:在时态XML文档模型设计上,本文采用的模型只保存不同时刻节点之间的关联关系,而不是保存某些时刻的快照,从而解决了分散在不同版本间的数据查询问题。在节点编码设计上,本文采用预留编码空间的方法,使得文档更新时,不需进行重新编码。在查询算法设计上,通过等价类划分和聚簇存储,减少了树遍历和磁盘读取次数。在维护算法设计上,使用增量更新的方式,避免了文档更新时索引的重建。
论文目录
相关论文文献
- [1].广告索引[J]. 中国医药工业杂志 2019(11)
- [2].广告索引[J]. 涂料工业 2019(12)
- [3].本期广告索引[J]. 岩土工程学报 2019(12)
- [4].广告索引[J]. 制造业自动化 2019(12)
- [5].广告索引[J]. 中国医药工业杂志 2019(12)
- [6].广告索引[J]. 油气田地面工程 2020(02)
- [7].产品名称索引[J]. 中国公共安全 2019(12)
- [8].本期广告索引[J]. 岩土工程学报 2020(01)
- [9].栏目索引[J]. 农业装备与车辆工程 2019(12)
- [10].第三十一卷(2019)索引[J]. 中外法学 2019(06)
- [11].本期广告索引[J]. 广东通信技术 2019(11)
- [12].公司索引[J]. 互联网周刊 2020(01)
- [13].本期新种索引[J]. 菌物学报 2020(02)
- [14].广告索引[J]. 香料香精化妆品 2020(01)
- [15].广告索引[J]. 油气田地面工程 2020(03)
- [16].广告索引[J]. 山东化工 2020(01)
- [17].广告索引[J]. 造纸科学与技术 2019(06)
- [18].本期广告索引[J]. 岩土工程学报 2020(02)
- [19].信息索引[J]. 中国检验检测 2020(01)
- [20].广告索引[J]. 铁道技术监督 2020(01)
- [21].栏目索引[J]. 农业装备与车辆工程 2020(01)
- [22].广告索引[J]. 水利信息化 2020(01)
- [23].广告索引[J]. 储能科学与技术 2020(02)
- [24].公司索引[J]. 电气时代 2020(02)
- [25].广告、信息索引[J]. 广西蚕业 2019(04)
- [26].广告索引[J]. 世界临床药物 2020(02)
- [27].广告索引[J]. 中国医药工业杂志 2020(01)
- [28].广告索引[J]. 油气田地面工程 2020(04)
- [29].本期广告索引[J]. 广东化工 2020(06)
- [30].广告索引[J]. 合成橡胶工业 2020(02)