粗糙集和计算智能相结合的数据挖掘算法研究

粗糙集和计算智能相结合的数据挖掘算法研究

论文摘要

海量数据与知识贫乏导致了数据挖掘技术的出现,它的主要目标是采用自动的、智能化的新技术来分析海量数据,以获得有效的、隐含的、以前未知的、有潜在使用价值的有用信息。它是当今众多学科领域特别是数据库领域最前沿的研究课题之一。粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想是在保持分类能力不变的情况下,通过知识约简,导出问题的决策或者分类规则。计算智能技术以神经网络、模糊逻辑以及进化计算等为核心,模仿人类的思维方式及演化规律,已经在工业控制、模式识别等领域得到了广泛的应用。目前,在数据挖掘领域粗糙集和计算智能方法相结合还主要用于数据预处理阶段,基于他们的分类、聚类和关联规则挖掘算法还很少。本文介绍了数据挖掘、粗糙集理论和计算智能理论的基本概念以及应用,分析了粗糙集理论和计算智能理论在数据挖掘方面的应用以及它们之间的互补性。针对粗糙集在处理符号属性方面的优势,设计了一种新的聚类算法,将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明该算法在面向符号属性进行聚类时具有较高的聚类准确率。此外,提出了一种新型分类算法,将粗糙集与组织协同进化分类算法相结合,利用支持子集的思想来决定组织的适应度,利用支持子集得到的启发信息来加快进化速度,增强种群之间的相互协同,实验表明,当数据集中的属性全部为符号属性时,该算法具有较高的分类准确率并且时间代价较小。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 国内外的研究发展现状
  • 1.2.1 粗糙集和模糊集的结合
  • 1.2.2 粗糙集和神经网络相结合
  • 1.2.3 粗糙集、模糊集和神经网络三者相结合
  • 1.2.4 粗糙集与遗传算法相结合
  • 1.3 主要工作
  • 1.4 论文的组成结构
  • 第二章 预备知识
  • 2.1 数据挖掘的发展
  • 2.1.1 发展概述
  • 2.1.2 研究热点
  • 2.1.3 未来研究方向
  • 2.2 数据挖掘的任务和方法
  • 2.2.1 数据挖掘的任务
  • 2.2.2 常用的方法
  • 2.3 数据挖掘的过程与应用
  • 2.3.1 数据挖掘的过程
  • 2.3.2 数据挖掘的应用
  • 2.4 粗糙集理论概述
  • 2.4.1 粗糙集理论的发展
  • 2.4.2 粗糙集理论的特点
  • 2.4.3 应用
  • 2.4.4 目前的研究热点
  • 2.5 粗糙集基本概念
  • 2.5.1 信息系统与决策表
  • 2.5.2 近似空间
  • 2.5.3 约简与核
  • 2.5.4 知识的依赖性
  • 2.6 粗糙集理论在数据挖掘中的应用
  • 2.6.1 数据预处理
  • 2.6.2 生成分类规则
  • 2.6.3 对规则的解释
  • 2.7 计算智能概述
  • 2.7.1 神经网络及其在数据挖掘方面的应用
  • 2.7.2 模糊集及其在数据挖掘方面的应用
  • 2.7.3 进化计算概述
  • 2.8 本章小结
  • 第三章 基于粗糙集和小生境遗传算法的层次聚类算法
  • 3.1 分裂式层次聚类算法
  • 3.2 遗传算法
  • 3.2.1 遗传算法的特点
  • 3.2.2 遗传算法的关键问题及方法
  • 3.2.3 遗传算法的一般流程
  • 3.3 小生境遗传算法
  • 3.4 用于聚类分析的粗糙集广义近似空间
  • 3.5 RNGADHCA 算法
  • 3.6 RNGAD 算法
  • 3.7 实验结果
  • 3.8 本章小结
  • 第四章 基于粗糙集和组织协同进化的分类算法
  • 4.1 组织协同进化算法
  • 4.1.1 协同进化算法
  • 4.1.2 组织协同进化算法
  • 4.2 基于粗糙集和组织协同进化的分类算法
  • 4.2.1 支持子集
  • 4.2.2 组织的构成及其进化算子
  • 4.2.3 种群更替算法
  • 4.2.4 分类规则的提取方法
  • 4.2.5 基于粗糙集和组织协同进化的分类算法
  • 4.3 实验结果
  • 4.4 本章小结
  • 第五章 结论与展望
  • 5.1 结论
  • 5.2 展望
  • 参考文献
  • 致谢
  • 附录 攻读学位期间发表论文目录
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    粗糙集和计算智能相结合的数据挖掘算法研究
    下载Doc文档

    猜你喜欢