论文摘要
随着数据库技术的迅速发展及其广泛应用,在数据库中积累的数据量越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够在已有的大量数据的基础上进行科学研究、商业决策或企业管理等更高层次的分析,从中提取有价值的信息,从而为管理和决策提供依据。数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本毕业设计的主要目标是研究发现多维数据间的关联性的有效方法。基于数据仓库和OLAP的多维数据分析法是以统计分析的方法对多维数据进行分析,而多维关联挖掘算法是用知识发现的方法分析多维数据之间的关联性。本论文从这两方面进行了研究。本文首先对基于数据仓库和OLAP的多维数据分析法进行了研究,主要有数据仓库的建模方法,利用OLAP对数据仓库中的多维数据进行分析的方法。并在此研究的基础上进行了高校毕业生就业状况分析数据仓库模型的设计,并利用OLAP提供的切片、切块、上卷和下钻等方法对高校毕业生就业状况进行了分析。其次,本文在对关联挖掘方法及其发展状况进行了研究的基础上,提出了一个基于SQL查询的多维关联规则挖掘算法,该算法利用SQL新标准中的CUBE运算符,并结合了SQL强大的查询功能,能够对一定数据量的多维数据集进行高效的多维关联挖掘。为实现对更大数据集的有效挖掘,采取分块挖掘的方式对算法进行了改进,本文对算法及其设计思想进行了详细的论述,并给出了对算法的一些测试结果。分析和实验表明,算法简单,易于实现,无需多遍扫描挖掘数据集,挖掘效率高。最后,为便于用户利用本算法进行多维关联挖掘,还将SQL Server数据库的强大数据处理功能和C#的面向对象的功能相结合,设计开发了可视化多维关联挖掘工具。
论文目录
摘要Abstract第一章 绪言1.1 本课题研究背景1.2 本文研究的目的和意义1.3 本文的主要研究内容和结构安排第二章 数据挖掘综述2.1 数据挖掘的概念2.2 数据挖掘算法分类及评价2.2.1 数据挖掘算法、分类及主要规则2.2.2 数据挖掘算法的评价标准2.3 关联规则挖掘方法2.3.1 关联规则研究现状2.3.2 挖掘关联规则算法的一般步骤2.3.3 主要研究的方向和典型算法2.3.4 多维关联规则挖掘方法2.4 本章小结第三章 基于数据仓库和OLAP 挖掘的多维分析方法3.1 数据仓库及其建模方法3.1.1 数据仓库概念3.1.2 数据仓库的内涵3.1.3 数据仓库的基本组成3.1.4 数据仓库体系结构3.1.5 数据仓库的数据模型3.2 多维数据模型的研究3.2.1 多维数据模型简介3.2.2 多维数据模型3.3 OLAP 概念及其数据分析方法3.3.1 OLAP 概念与体系结构3.3.2 OLAP 多维数据分析方法3.4 基于数据仓库和OLAP 的高校毕业生就业状况分析模型设计3.4.1 数据仓库设计3.4.2 事实表和维表的设计3.4.3 数据立方体及切片和切块3.4.4 下钻和上卷3.5 本章小结第四章 关联规则挖掘算法研究4.1 基本问题描述4.1.1 频繁数据项4.1.2 关联规则4.2 关联规则常用算法4.2.1 AIS 算法简介4.2.2 Apriori 算法分析研究4.2.3 DHP 算法分析研究4.3 本章小结第五章 多维关联规则挖掘算法设计与实现5.1 研究多维关联挖掘算法的必要性5.2 多维关联规则的相关概念5.2.1 多维关联规则的定义5.2.2 多维关联规则的分类5.3 算法及其设计基本思想5.3.1 基本思想5.3.2 量化属性的离散化方法5.3.3 对用户偏好的支持5.3.4 算法描述5.4 增强的挖掘算法5.4.1 基本思想5.4.2 挖掘的基本过程5.4.3 增强的挖掘算法5.5 算法实验结果及特征分析5.5.1 实验结果分析5.5.2 算法特性分析5.6 挖掘工具设计与实现5.6.1 创建数据库5.6.2 C#数据库访问机制5.6.3 挖掘流程图5.6.4 系统可视化界面设计5.7 本章小结第六章 总结与展望6.1 总结6.2 展望参考文献发表论文和科研情况说明致谢
相关论文文献
标签:数据仓库论文; 多维数据挖掘论文; 关联规则论文;