基于粒度原理的聚类分析及规则挖掘技术研究

基于粒度原理的聚类分析及规则挖掘技术研究

论文摘要

近年来,随着信息技术和数据仓库技术的发展,数据挖掘作为一个全新的信息处理技术迅速发展并逐步走向成熟。数据挖掘就是一种从大量的数据中提取新颖的,隐含的,有效的信息的高级处理过程。聚类分析技术和关联规则挖掘技术是数据挖掘领域中两种有效的信息处理方法。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或组处理的重要手段和方法。聚类分析也可以看作一种数据预处理技术,用于发现隐藏在海量数据中的有价值的未知类,为信息的高效分析处理提供技术支持聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域;关联规则挖掘技术用于从大规模数据库中提取有价值的规则,从而对人类的实践活动提供指导。粒度计算理论是对人类分析和解决问题的过程的一种模拟,它是一种新的信息处理方法,它利用了人类能从不同的粒度去思考、分析和解决问题的重要特性,用于处理一些复杂的、非结构化的、不完整的、不确定的信息。分层递阶这一概念正是粒度计算这一思维方法的重要体现,它很早就已经广泛应用到电子信息,自动控制以及管理决策等学科领域当中已经被应用于许多领域中。本文从数据挖掘的理论出发,着重阐述了聚类分析技术和规则挖掘技术的理论和特点,利用粒度计算的层次化分析解决问题的思想,提出了基于粒度原理的层次规则挖掘算法,它采用“分裂—凝聚”的层次化方法是对数据进行分析归类,有效的解决了传统聚类分析算法在出处理海量数据时存在时空性能方面的不足的问题,并从理论和实验两个角度证明了新算法的可行性和时空效率,具有一定的实用价值。最后,在对传统的关联挖掘方法进行分析研究,了解其特性与不足的基础上,利用信息粒在数据层次化和频繁集求解方面的优势,将粒度原理与规则挖掘方法相结合,得到了基于粒度原理的层次规则挖掘方法,并用实例分析了算法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 数据挖掘理论概述
  • 1.1.1 引言
  • 1.1.2 数据挖掘的定义
  • 1.1.3 数据挖掘的功能
  • 1.1.4 数据挖掘的基本步骤
  • 1.2 数据挖掘技术的研究方向
  • 1.3 论文的研究内容
  • 第2章 粒度计算
  • 2.1 粒度计算的起源
  • 2.2 粒度计算的定义
  • 2.3 粒度计算的基本成分
  • 2.4 粒度计算的基本问题
  • 2.5 粒计算的三大理论模型
  • 2.5.1 模糊集理论模型
  • 2.5.2 Rough集
  • 2.5.3 商空间理论
  • 2.6 本章小结
  • 第3章 基于粒度原理的层次聚类算法
  • 3.1 聚类分析概述
  • 3.1.1 聚类模型描述
  • 3.1.2 聚类算法的步骤
  • 3.1.3 主要聚类算法分类
  • 3.2 聚类中的粒度原理
  • 3.3 聚类中的簇间距离度量方法
  • 3.3.1 簇间距离的计算
  • 3.3.2 簇的评估方法
  • 3.4 粒度空间原理与粒度划分方法
  • 3.4.1 粒度空间的数学模型
  • 3.4.2 粒度划分方法
  • 3.4.3 算法过程描述及分析
  • 3.4.4 算法性能分析
  • 3.5 实验对比分析
  • 3.6 本章小结
  • 第4章 基于粒度原理的层次规则挖掘算法
  • 4.1 规则挖掘
  • 4.1.1 规则挖掘概述
  • 4.1.2 关联规则挖掘算法的步骤
  • 4.1.3 规则挖掘典型算法
  • 4.2 规则挖掘中的粒计算
  • 4.3 基于粒度计算的规则挖掘的基本模型及相关定义
  • 4.3.1 关联规则的一般定义
  • 4.3.2 信息粒及其二进制表示方法
  • 4.3.3 基于粒度计算的关联规则定义
  • 4.4 基于粒度原理的层次规则挖掘算法
  • 4.4.1 数据集的层次化编码
  • 4.4.2 算法的基本思想
  • 4.4.3 算法过程及其伪代码描述
  • 4.4.4 算法举例
  • 4.4.5 算法性能分析
  • 4.5 本章小结
  • 第5章 结束语
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于粒度原理的聚类分析及规则挖掘技术研究
    下载Doc文档

    猜你喜欢