一种基于Dewey编码的XML小枝模式匹配方法

一种基于Dewey编码的XML小枝模式匹配方法

论文摘要

近几年来,随着数据库和网络技术的迅速发展,XML(可扩展标记语言)已成为Web上数据表示、集成和交换的标准。相比其它的标记语言,XML的格式简单、自我描述能力强,实现了内容、结构和表现三者的分离,更适合于数据表示和交换,因此XML在科学研究、电子商务等各个领域得到了广泛的使用。今天Web上已经涌现了大量的XML数据,所以如何对XML文档进行有效地查询已成为当今数据库领域的一个重要的研究课题。查询XML文档,目前国内外提出的算法主要是基于以下两种思想:第一种是路径分解法,它把将要查询的路径表达式分解成多个简单路径表达式,然后再进行匹配,最后将中间结果连接起来。这种方法不可避免地要产生许多无用的中间结果。另一种是小枝模式匹配方法,它将查询表达式用树的形式建模,称为“小枝模式”(twigpattern),再将小枝模式到XML文档树中进行匹配,通过扫描一遍输入结点列表就可得到所有的输出结果。这种方法使得算法的I/O代价、CPU时间复杂度和空间复杂度都大大降低,从而提高了查询的效率。目前具有代表性的小枝模式匹配算法有TwigStack和TJfast等。但是,对于包含较多父子边的查询语句这些算法并不是最优的,同时这些算法的一个共同点就是它们并没有利用XML文档的路径索引。为了进一步提高小枝模式匹配算法的效率,本文利用了XML文档的路径索引JoinGuide,提出了一种新的基于Dewey编码的小枝模式匹配方法TwigJoin,主要工作如下:(1)综合区域编码和前缀编码的优点对XML文档进行了编码,对于文档中的实例结点我们使用了前缀编码方案,而对XML文档的路径索引JoinGuide使用了区域编码的方案。(2)对小枝模式匹配算法TwigStack进行了改进,先使用TwigStack算法在XML文档的索引图JoinGuide上得到预匹配结果,然后再扫描预匹配结果中的叶子实例结点序列得到所需的查询结果。(3)在理论上和TwigStack和I-XISS系统进行了详细的对比分析,说明了TwigJoin小枝模式匹配方法的优点。(4)最后构建了一个实验系统,实现了提出的小枝模式匹配方法,然后通过实验把TwigJoin同TwigStack和I-XISS进行了对比,结果表明本文提出的小枝模式匹配方法的效率有了较大的提高。今后的工作是,首先要提高TwigJoin系统中解析和建立路径索引的效率,然后再完善TwigJoin系统中的查询算法,增加TwigJoin系统中对XPath查询语言中各种轴的查询能力,以使其适应更复杂的XML数据查询语句。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 国内外研究现状
  • 1.2 本文的主要工作
  • 1.3 论文的组织结构
  • 第二章 XML数据库相关知识
  • 2.1 XML文档的数据模型
  • 2.2 XML数据的编码方案
  • 2.3 XML数据的索引
  • 2.4 XML查询语言
  • 2.5 XML查询算法
  • 第三章 XML文档及其JoinGuide索引的关系存储
  • 3.1 XML文档的编码方法
  • 3.2 XML文档的索引JoinGuide
  • 3.3 XML文档索引JoinGuide的逻辑结构图
  • 3.4 XML文档的关系存储
  • 3.5 关系存储的主要算法
  • 第四章 基于Dewey编码的小枝模式匹配方法TwigJoin
  • 4.1 小枝模式匹配的定义
  • 4.2 XPath查询表达式的表示方法
  • 4.3 小枝模式匹配方法TwigJoin
  • 4.4 TwigJoin同TwigStack和I-XISS的对比分析
  • 4.5 各种路径表达式的处理方法
  • 4.6 主要算法
  • 第五章 TwigJoin查询系统的设计与实现
  • 5.1 查询系统的设计
  • 5.2 查询系统的实现
  • 第六章 实验与分析
  • 第七章 结束语
  • 参考文献
  • 致谢
  • 附录
  • 个人简况及联系方式
  • 相关论文文献

    • [1].Dewey's Educational Thoughts and the Enlightenment for English Teaching in China[J]. 中学生英语 2018(38)
    • [2].美国将艺术融入学科教学[J]. 上海教育 2017(20)
    • [3].Aims of Education from the Perspectives of its Functions——A review on Dewey's Democracy and Education[J]. 校园英语 2014(35)
    • [4].Analysis of John Dewey's Philosophy of Education and Its Value[J]. 海外英语 2012(21)
    • [5].PBT教学模式在管理研究方法教学中的应用[J]. 学习月刊 2010(17)
    • [6].一种采用扩展Dewey编码非归并的小枝模式查询算法[J]. 小型微型计算机系统 2011(05)
    • [7].面向更新的扩展Dewey编码[J]. 计算机科学与探索 2010(10)
    • [8].XML关键字检索中Dewey码存储方式的研究[J]. 计算机工程与应用 2013(01)
    • [9].基于Dewey编码的XML多重索引[J]. 福建工程学院学报 2010(01)
    • [10].一种降低XML文档更新代价的扩展Dewey编码方案[J]. 沈阳师范大学学报(自然科学版) 2010(02)
    • [11].XML文档的Dewey编码生成算法[J]. 计算机工程 2010(19)
    • [12].包含Dewey码的XML文档映射关系数据库策略[J]. 计算机工程与应用 2012(27)
    • [13].一种新的基于Dewey编码的XML路径索引[J]. 计算机技术与发展 2010(10)
    • [14].基于扩展Dewey编码的XML结构连接算法[J]. 计算机工程与设计 2012(07)
    • [15].期刊收录证书[J]. 中国矫形外科杂志 2012(04)
    • [16].基于Ex-Dewey前缀编码与R树的GML空间数据索引机制[J]. 地球信息科学学报 2010(02)
    • [17].一种基于前缀编码的查询算法[J]. 怀化学院学报 2010(11)
    • [18].基于压缩策略的安全XML关键字查询[J]. 计算机工程与应用 2011(36)
    • [19].连续不确定XML的Top-k查询算法研究[J]. 计算机工程与设计 2013(03)
    • [20].教育领域中项目方法的历史渊源[J]. 科协论坛(下半月) 2010(09)
    • [21].合作学习的研究现状[J]. 考试与评价 2016(03)
    • [22].体验,为了更好地实践[J]. 湖北美术学院学报 2011(03)
    • [23].XML/GML非空间数据查询的结构连接算法[J]. 计算机工程 2010(03)
    • [24].中国的“传统”与“现代”[J]. 读书 2010(08)
    • [25].面向PSTP查询的高效处理算法[J]. 计算机科学与探索 2010(11)
    • [26].浅谈如何把握艺术教学的目的性[J]. 艺术教育 2010(05)
    • [27].2014年高考试题微改编[J]. 高中生之友 2014(17)
    • [28].浅析网络探究教学模式的设计[J]. 湖北函授大学学报 2012(01)
    • [29].感悟分享[J]. 新课程教学(电子版) 2015(10)
    • [30].一种改进的XML关键字查询算法[J]. 南京工程学院学报(自然科学版) 2011(02)

    标签:;  ;  ;  ;  

    一种基于Dewey编码的XML小枝模式匹配方法
    下载Doc文档

    猜你喜欢