支持压缩域查询的XML数据压缩方法研究

支持压缩域查询的XML数据压缩方法研究

论文题目: 支持压缩域查询的XML数据压缩方法研究

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 张万松

导师: 刘大昕

关键词: 规范化,数据冗余,数据压缩,查询处理,存取控制规则

文献来源: 哈尔滨工程大学

发表年度: 2005

论文摘要: 近年来,随着Internet的迅猛发展,XML已经成为数据交换和表示的主要标准。由于XML具有良好的可扩展性和跨平台性,越来越多的信息以XML文件的形式进行交换和存储。XML数据的一个特点是存在较大的数据冗余,会造成存储空间的浪费、查询效率的降低。因此,对XML数据行有效压缩和查询成为XML数据库研究领域的一个重要的研究问题。 本文主要研究XML数据的压缩和查询技术,对XML数据的存储模式拆分调整、XML数据的规范化存储、XML数据的相似性分析、频繁子树的挖掘、基于树文法的压缩、基于签名自动机的压缩数据查询技术等方面进行了深入的研究,提出了有效的算法。 本文的研究工作主要围绕以下几个方面进行: 首先对XML的研究历史与现状进行综述,分析了当前XML数据压缩与查询的研究现状和目前已有XML数据压缩方法的不足,并指出了研究主题及目标。 其次,提出了XML模式规范化方法,利用函数依赖和规范化规则发现和消除XML文档中存在的冗余结构,实现在语义一级消除XML数据冗余;研究并阐述了基于树文法的XML数据压缩方法。研究了XML文档集之间和文档内部的结构冗余问题,并在此基础上,通过对文档集进行聚类、发现频繁子树,最终实现压缩,并对所提出的算法进行了实验,验证了算法的功能和有效性;提出了基于压缩域的XML压缩数据查询处理方法。为了实现非完全解压缩状态下的查询处理问题,提出将签名技术和自动机技术相结合的基于签名自动机的查询处理算法,实现XML压缩数据在非完全解压缩状态下的查询处理;提出了XML数据存取控制规则的压缩与查询方法。为了处理XML压缩数据的安全控制,以及由此带来的存取控制规则规模膨胀的问题,提出了基于DAC模型的存取规则剪枝处理方法,有效地压缩存取控制规则所占用的空间,并给出了规则压缩的查询处理方法。

论文目录:

第1章 绪论

1.1 研究的目的及意义

1.2 XML简介

1.2.1 XML的历史

1.2.2 XML数据

1.3 数据压缩

1.4 XML数据压缩研究现状

1.4.1 不支持查询的XML压缩方法

1.4.2 支持查询的XML压缩方法

1.4.3 XML数据压缩的必要性

1.5 研究主题及目标

1.6 主要研究内容

1.7 论文的组织结构

第2章 XML数据模型及查询语言

2.1 XML数据模型

2.1.1 OEM模型

2.1.2 XML数据模型

2.1.3 XML文档类型定义

2.2 XML查询语言

2.2.1 XPath查询语言

2.2.2 匹配规则

2.3 本章小结

第3章 基于函数依赖的XML数据冗余消除

3.1 问题的提出

3.2 相关工作

3.3 基本概念

3.3.1 文档类型定义和 XML树模型

3.3.2 路径表达式

3.4 XML范式

3.4.1 XML函数依赖

3.4.2 XML键

3.4.3 XK-NF范式

3.5 消除冗余的模式树分解

3.5.1 分解规则

3.5.2 分解算法

3.6 本章小结

第4章 基于树文法的XML文档压缩

4.1 XML文档聚类

4.1.1 动机

4.1.2 k-means算法

4.1.3 紧凑结构树C-Tree的构造

4.1.4 XML文档相似性计算

4.1.5 基于编辑距离的XML文档差值

4.1.6 实验结果及分析

4.2 基于频繁子树的字典生成方法

4.2.1 XML文档树频繁结构挖掘

4.3 基于树文法的 XML数据压缩方法

4.3.1 基于文法的数据压缩方法简介

4.3.2 相关工作

4.3.3 基本概念

4.3.4 GXC压缩算法

4.4 性能比较

4.5 本章小结

第5章 XML压缩数据的查询处理

5.1 系统目标

5.2 XQueezer系统的系统组成及主要功能

5.3 SS-Index索引及压缩数据的查询处理

5.3.1 问题的提出

5.3.2 节点签名

5.3.3 基于自动机的查询处理

5.3.4 实验结果

5.4 本章小结

第6章 XML文件访问控制规则的压缩与查询

6.1 动机

6.2 DAC模型

6.3 授权规则的形式化描述

6.4 访问控制的粒度问题

6.5 粒度冲突问题

6.6 存取控制图ACM的构造

6.7 存取控制图的剪枝与查询方法

6.8 本章小结

结论

参考文献

攻读博士学位期间发表的论文和取得的科研成果

致谢

发布时间: 2005-10-21

相关论文

  • [1].基于结构化联接的XML查询模式匹配关键技术研究[D]. 庞引明.复旦大学2004
  • [2].基于约束的XML数据库模式规范化研究[D]. 张忠平.复旦大学2004
  • [3].XML约束在XML数据存储、发布和转换中的应用[D]. 王庆.复旦大学2004
  • [4].XML的完整性约束[D]. 谈子敬.复旦大学2003
  • [5].基于XML的产品数据模式、存储及共享模型的研究[D]. 陆静平.重庆大学2003
  • [6].XML数据的查询、转换和集成[D]. 郭志懋.复旦大学2005
  • [7].XML索引和过滤查询若干关键技术研究[D]. 雷向欣.复旦大学2005
  • [8].XML数据库查询及其模式集成研究[D]. 徐德智.中南大学2004
  • [9].XML数据库查询优化及相关技术研究[D]. 孙伟.哈尔滨工程大学2006
  • [10].面向对象的XML数据管理技术研究[D]. 张晓琳.东北大学2006

标签:;  ;  ;  ;  ;  

支持压缩域查询的XML数据压缩方法研究
下载Doc文档

猜你喜欢