论文摘要
数据库技术经过多年的不断发展已经成为当今IT领域最成功的技术之一,它推动了全球范围内的商业、政务、金融等方面数据管理的发展。当代数据的三个典型特点使得传统关系数据库捉襟见肘、疲于应付。首先是数据信息海量化,其次是信息共享化,最后是数据类型多样化。针对这些特点,传统数据库已经不能满足当前信息化发展日益增长的需要。数据空间(dataspace)是一个抽象的数据管理概念,旨在克服当前遇到的挑战。其目的是减少需要设置通过利用现有的匹配和映射生成技术依托数据集成系统的方法,因为它是使用以改善系统随收随付即付(Pay as you go)方式进行管理的。本文基于现有数据空间研究成果的基础上,对数据空间的组织形式,数据空间中关联关系规则的挖掘以及知识发现,数据空间的查询处理以及结果排序进行了研究。首先,本文在分析以往数据空间管理系统体系结构的基础上,将数据空间分为对象模型层、基础层、资源层、分析层以及管理层五层体系结构。其次,通过定义SPORD模型来表示资源层数据组织形式,随后针对数据空间资源层资源节点之间关联关系,提出了一个基于FP-tree的改进模型,实现多维关联关系规则发现。再次,将数据空间查询处理分为内容查询、结构化查询以及语义查询,重点介绍通过MS-SteinierTree算法对语义查询处理,以及结果top-k排序。最后,以C#、VS2008为实验平台,通过实验对MDFP-tree模型以及MS-SteinierTree算法进行性能以及可行性验证。实验结果证明MDFP-tree算法和MS-SteinierTree算法的具有优越性和可行性。
论文目录
摘要Abstract目录第1章 绪论1.1 本文课题背景1.2 国内外研究现状1.3 本文研究内容1.4 本文组织结构第2章 相关概念与技术2.1 数据空间概述2.2 数据空间中的关键技术2.3 数据空间的数据管理策略2.4 本章小结第3章 数据空间管理系统PDM设计3.1 PDM的总体结构3.2 对象模型层3.3 基础层3.4 资源层3.5 分析层3.6 管理层3.7 本章小结第4章 多维频繁集发现模型研究4.1 数据组织模型4.1.1 SPORD模型4.1.2 R相关程度值计算4.1.3 SPORD模型表示方法4.2 资源域的关联关系4.3 多维频繁集发现模型4.3.1 多维频繁规则的基本概念4.3.2 关联规则的度量值4.4 MDFP-tree建立4.4.1 MDFP-tree模型4.4.2 MDFP-tree模型建立4.5 基于MDFP-tree的关联规则挖掘与知识发现4.6 建立资源节点关联关系语义图4.7 本章小节第5章 数据空间中关联关系查询处理5.1 基于内容的查询处理5.2 基于结构的查询处理5.3 基于语义查询处理5.3.1 MS-SteinierTree算法介绍5.3.2 MS-SteinierTree算法实现5.3.3 查询结果top-k排序5.4 本章小结第6章 实验及分析6.1 实验环境6.2 实验结果与性能分析6.2.1 实验1 数据增长对MDPF模型发现的算法性能影响sup对算法性能的影响'>6.2.2 实验2 最小支持度minsup对算法性能的影响6.2.3 实验3 语义查询目标节点对平均权值的影响6.2.4 实验4 基于MS-steinierTree模型语义查询算法性能分析6.2.5 实验5 多维频繁模型发现方法对查询结果的影响6.3 本章小结第7章 总结及展望7.1 本文的主要工作7.2 未来研究工作参考文献致谢攻读硕士学位期间发表的论文和参加的项目
相关论文文献
标签:数据空间论文; 多维频繁论文; 语义查询论文;