论文摘要
海量数据与知识贫乏导致了数据挖掘技术的出现,它的主要目标是采用自动的、智能化的新技术来分析海量数据,以获得有效的、隐含的、以前未知的、有潜在使用价值的有用信息。它是当今众多学科领域特别是数据库领域最前沿的研究课题之一。粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想是在保持分类能力不变的情况下,通过知识约简,导出问题的决策或者分类规则。计算智能技术以神经网络、模糊逻辑以及进化计算等为核心,模仿人类的思维方式及演化规律,已经在工业控制、模式识别等领域得到了广泛的应用。目前,在数据挖掘领域粗糙集和计算智能方法相结合还主要用于数据预处理阶段,基于他们的分类、聚类和关联规则挖掘算法还很少。本文介绍了数据挖掘、粗糙集理论和计算智能理论的基本概念以及应用,分析了粗糙集理论和计算智能理论在数据挖掘方面的应用以及它们之间的互补性。针对粗糙集在处理符号属性方面的优势,设计了一种新的聚类算法,将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明该算法在面向符号属性进行聚类时具有较高的聚类准确率。此外,提出了一种新型分类算法,将粗糙集与组织协同进化分类算法相结合,利用支持子集的思想来决定组织的适应度,利用支持子集得到的启发信息来加快进化速度,增强种群之间的相互协同,实验表明,当数据集中的属性全部为符号属性时,该算法具有较高的分类准确率并且时间代价较小。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景和意义1.2 国内外的研究发展现状1.2.1 粗糙集和模糊集的结合1.2.2 粗糙集和神经网络相结合1.2.3 粗糙集、模糊集和神经网络三者相结合1.2.4 粗糙集与遗传算法相结合1.3 主要工作1.4 论文的组成结构第二章 预备知识2.1 数据挖掘的发展2.1.1 发展概述2.1.2 研究热点2.1.3 未来研究方向2.2 数据挖掘的任务和方法2.2.1 数据挖掘的任务2.2.2 常用的方法2.3 数据挖掘的过程与应用2.3.1 数据挖掘的过程2.3.2 数据挖掘的应用2.4 粗糙集理论概述2.4.1 粗糙集理论的发展2.4.2 粗糙集理论的特点2.4.3 应用2.4.4 目前的研究热点2.5 粗糙集基本概念2.5.1 信息系统与决策表2.5.2 近似空间2.5.3 约简与核2.5.4 知识的依赖性2.6 粗糙集理论在数据挖掘中的应用2.6.1 数据预处理2.6.2 生成分类规则2.6.3 对规则的解释2.7 计算智能概述2.7.1 神经网络及其在数据挖掘方面的应用2.7.2 模糊集及其在数据挖掘方面的应用2.7.3 进化计算概述2.8 本章小结第三章 基于粗糙集和小生境遗传算法的层次聚类算法3.1 分裂式层次聚类算法3.2 遗传算法3.2.1 遗传算法的特点3.2.2 遗传算法的关键问题及方法3.2.3 遗传算法的一般流程3.3 小生境遗传算法3.4 用于聚类分析的粗糙集广义近似空间3.5 RNGADHCA 算法3.6 RNGAD 算法3.7 实验结果3.8 本章小结第四章 基于粗糙集和组织协同进化的分类算法4.1 组织协同进化算法4.1.1 协同进化算法4.1.2 组织协同进化算法4.2 基于粗糙集和组织协同进化的分类算法4.2.1 支持子集4.2.2 组织的构成及其进化算子4.2.3 种群更替算法4.2.4 分类规则的提取方法4.2.5 基于粗糙集和组织协同进化的分类算法4.3 实验结果4.4 本章小结第五章 结论与展望5.1 结论5.2 展望参考文献致谢附录 攻读学位期间发表论文目录
相关论文文献
标签:粗糙集论文; 数据挖掘论文; 计算智能论文; 遗传算法论文; 组织协同进化论文; 分类论文; 聚类论文;