论文摘要
近年来,随着信息技术和数据仓库技术的发展,数据挖掘作为一个全新的信息处理技术迅速发展并逐步走向成熟。数据挖掘就是一种从大量的数据中提取新颖的,隐含的,有效的信息的高级处理过程。聚类分析技术和关联规则挖掘技术是数据挖掘领域中两种有效的信息处理方法。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或组处理的重要手段和方法。聚类分析也可以看作一种数据预处理技术,用于发现隐藏在海量数据中的有价值的未知类,为信息的高效分析处理提供技术支持聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域;关联规则挖掘技术用于从大规模数据库中提取有价值的规则,从而对人类的实践活动提供指导。粒度计算理论是对人类分析和解决问题的过程的一种模拟,它是一种新的信息处理方法,它利用了人类能从不同的粒度去思考、分析和解决问题的重要特性,用于处理一些复杂的、非结构化的、不完整的、不确定的信息。分层递阶这一概念正是粒度计算这一思维方法的重要体现,它很早就已经广泛应用到电子信息,自动控制以及管理决策等学科领域当中已经被应用于许多领域中。本文从数据挖掘的理论出发,着重阐述了聚类分析技术和规则挖掘技术的理论和特点,利用粒度计算的层次化分析解决问题的思想,提出了基于粒度原理的层次规则挖掘算法,它采用“分裂—凝聚”的层次化方法是对数据进行分析归类,有效的解决了传统聚类分析算法在出处理海量数据时存在时空性能方面的不足的问题,并从理论和实验两个角度证明了新算法的可行性和时空效率,具有一定的实用价值。最后,在对传统的关联挖掘方法进行分析研究,了解其特性与不足的基础上,利用信息粒在数据层次化和频繁集求解方面的优势,将粒度原理与规则挖掘方法相结合,得到了基于粒度原理的层次规则挖掘方法,并用实例分析了算法的有效性。
论文目录
摘要Abstract第1章 绪论1.1 数据挖掘理论概述1.1.1 引言1.1.2 数据挖掘的定义1.1.3 数据挖掘的功能1.1.4 数据挖掘的基本步骤1.2 数据挖掘技术的研究方向1.3 论文的研究内容第2章 粒度计算2.1 粒度计算的起源2.2 粒度计算的定义2.3 粒度计算的基本成分2.4 粒度计算的基本问题2.5 粒计算的三大理论模型2.5.1 模糊集理论模型2.5.2 Rough集2.5.3 商空间理论2.6 本章小结第3章 基于粒度原理的层次聚类算法3.1 聚类分析概述3.1.1 聚类模型描述3.1.2 聚类算法的步骤3.1.3 主要聚类算法分类3.2 聚类中的粒度原理3.3 聚类中的簇间距离度量方法3.3.1 簇间距离的计算3.3.2 簇的评估方法3.4 粒度空间原理与粒度划分方法3.4.1 粒度空间的数学模型3.4.2 粒度划分方法3.4.3 算法过程描述及分析3.4.4 算法性能分析3.5 实验对比分析3.6 本章小结第4章 基于粒度原理的层次规则挖掘算法4.1 规则挖掘4.1.1 规则挖掘概述4.1.2 关联规则挖掘算法的步骤4.1.3 规则挖掘典型算法4.2 规则挖掘中的粒计算4.3 基于粒度计算的规则挖掘的基本模型及相关定义4.3.1 关联规则的一般定义4.3.2 信息粒及其二进制表示方法4.3.3 基于粒度计算的关联规则定义4.4 基于粒度原理的层次规则挖掘算法4.4.1 数据集的层次化编码4.4.2 算法的基本思想4.4.3 算法过程及其伪代码描述4.4.4 算法举例4.4.5 算法性能分析4.5 本章小结第5章 结束语参考文献致谢攻读硕士学位期间发表的学术论文
相关论文文献
标签:粒度计算论文; 数据挖掘论文; 层次聚类算法论文; 规则挖掘论文; 信息粒论文;