数据空间中数据资源之间关联关系发现与语义查询研究

论文摘要

数据库技术经过多年的不断发展已经成为当今IT领域最成功的技术之一,它推动了全球范围内的商业、政务、金融等方面数据管理的发展。当代数据的三个典型特点使得传统关系数据库捉襟见肘、疲于应付。首先是数据信息海量化,其次是信息共享化,最后是数据类型多样化。针对这些特点,传统数据库已经不能满足当前信息化发展日益增长的需要。数据空间（dataspace）是一个抽象的数据管理概念,旨在克服当前遇到的挑战。其目的是减少需要设置通过利用现有的匹配和映射生成技术依托数据集成系统的方法,因为它是使用以改善系统随收随付即付（Pay as you go）方式进行管理的。本文基于现有数据空间研究成果的基础上,对数据空间的组织形式,数据空间中关联关系规则的挖掘以及知识发现,数据空间的查询处理以及结果排序进行了研究。首先,本文在分析以往数据空间管理系统体系结构的基础上,将数据空间分为对象模型层、基础层、资源层、分析层以及管理层五层体系结构。其次,通过定义SPORD模型来表示资源层数据组织形式,随后针对数据空间资源层资源节点之间关联关系,提出了一个基于FP-tree的改进模型,实现多维关联关系规则发现。再次,将数据空间查询处理分为内容查询、结构化查询以及语义查询,重点介绍通过MS-SteinierTree算法对语义查询处理,以及结果top-k排序。最后,以C#、VS2008为实验平台,通过实验对MDFP-tree模型以及MS-SteinierTree算法进行性能以及可行性验证。实验结果证明MDFP-tree算法和MS-SteinierTree算法的具有优越性和可行性。

论文目录

摘要

Abstract

第1章绪论

1.1 本文课题背景

1.2 国内外研究现状

1.3 本文研究内容

1.4 本文组织结构

第2章相关概念与技术

2.1 数据空间概述

2.2 数据空间中的关键技术

2.3 数据空间的数据管理策略

2.4 本章小结

第3章数据空间管理系统PDM设计

3.1 PDM的总体结构

3.2 对象模型层

3.3 基础层

3.4 资源层

3.5 分析层

3.6 管理层

3.7 本章小结

第4章多维频繁集发现模型研究

4.1 数据组织模型

4.1.1 SPORD模型

4.1.2 R相关程度值计算

4.1.3 SPORD模型表示方法

4.2 资源域的关联关系

4.3 多维频繁集发现模型

4.3.1 多维频繁规则的基本概念

4.3.2 关联规则的度量值

4.4 MDFP-tree建立

4.4.1 MDFP-tree模型

4.4.2 MDFP-tree模型建立

4.5 基于MDFP-tree的关联规则挖掘与知识发现

4.6 建立资源节点关联关系语义图

4.7 本章小节

第5章数据空间中关联关系查询处理

5.1 基于内容的查询处理

5.2 基于结构的查询处理

5.3 基于语义查询处理

5.3.1 MS-SteinierTree算法介绍

5.3.2 MS-SteinierTree算法实现

5.3.3 查询结果top-k排序

5.4 本章小结

第6章实验及分析

6.1 实验环境

6.2 实验结果与性能分析

6.2.1 实验1 数据增长对MDPF模型发现的算法性能影响

sup对算法性能的影响'>6.2.2 实验2 最小支持度min_sup对算法性能的影响

6.2.3 实验3 语义查询目标节点对平均权值的影响

6.2.4 实验4 基于MS-steinierTree模型语义查询算法性能分析

6.2.5 实验5 多维频繁模型发现方法对查询结果的影响

6.3 本章小结

第7章总结及展望

7.1 本文的主要工作

7.2 未来研究工作

参考文献

致谢

攻读硕士学位期间发表的论文和参加的项目

数据空间中数据资源之间关联关系发现与语义查询研究

论文摘要

论文目录

相关论文文献

猜你喜欢