基于粗糙集理论的知识发现方法研究

论文摘要

粗糙集理论是上世纪八十年代初由波兰数学家Z.Pawlak首先提出的一种用于数据分析的数学理论,它能处理含糊性和不精确性问题。自上世纪九十年代起,该理论日益受到重视,并成为国际学术界的研究热点之一。经过二十年的发展,粗糙集理论已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域获得成功应用。本文主要对粗糙集理论在知识发现中应用的关键问题进行了研究。第一章对知识发现进行了概述,介绍了知识发现的基本步骤、基本方法、基本任务等。而后对粗糙集理论进行了概述,介绍了粗糙集理论产生的背景、粗糙集理论的发展、以及对粗糙集应用于知识发现的优点作了阐述。第二章介绍了粗糙集理论的一些基本概念,并将粗糙集与其他几种处理不确定性理论作了比较。第三章对离散化问题进行了研究,从启发式方法和基于遗传算法的方法两个方面进行了研究。通过对初始断点集进行精简,将Nguyen S H提出的著名的离散化算法进行了改进,改进后的算法在空间复杂度和时间复杂度上都有较大程度的降低;另外,提出了一种免疫算法用于求解决策系统的离散化问题,它与启发式算法相比能获得更小且一致的离散化结果,为粗糙集中连续属性离散化提供了一种新的思想。第四章对于决策系统属性约简问题,从信息论角度定义了一种新的属性重要性度量方法。与基于互信息增益的方法不同的是:这种度量方法不仅考虑了属性的值域的大小,而且还考虑了取值的分布。基于此度量,构造了相应的启发式算法,对多个数据集的实验结果表明该方法能更有效地对决策系统进行约简。第五章研究了决策规则的获取,重点是针对不一致决策系统,提出了一种修改的基于分类一致性的规则获取算法,对每个决策类计算出相应的下近似集与上近似集,然后用决策类的下近似集获得确定性规则,上近似集获得概率性规则。在规则获取时采用属性重要性方法,与LEM2相比,它能一次获得多条规则。通过对Hayes数据集的实验表明了算法的有效性。

论文目录

摘要

Abstract

第1章绪论

1.1 知识发现概述

1.1.1 知识发现的概念

1.1.2 知识发现的过程

1.1.3 知识发现的任务

1.1.4 知识发现的方法

1.2 粗糙集理论概述

1.2.1 粗糙集理论提出的背景

1.2.2 粗糙集理论国内外发展现状

1.2.3 粗糙集理论及其应用研究现状

1.3 知识发现与粗糙集

1.4 本文主要内容和组织

第2章粗糙集理论基础

2.1 粗糙集的基本概念

2.1.1 知识与分类

2.1.2 知识的等价与粗细关系

2.1.3 信息系统与决策系统

2.1.4 上近似、下近似与粗糙集

2.1.5 精确性度量

2.1.6 划分的近似

2.1.7 约简与核

2.2 粗糙集与其他不确定性理论的比较

2.2.1 粗糙集与模糊集

2.2.2 粗糙集与概率统计方法

2.2.3 粗糙集与Dempster-Shafer证据理论

第3章决策系统中连续属性的离散化

3.1 引言

3.2 粗糙集中的离散化问题

3.3 一种改进的启发式离散化方法

3.3.1 改进算法中初始断点集的确定

3.3.2 改进后的启发式算法

3.3.3 一个示例

3.3.4 实验比较

3.4 基于免疫算法的离散化方法

3.4.1 免疫算法机理

3.4.2 免疫算法的计算流程

3.4.3 算法框架

*'>3.4.4 初始断点集与构造新决策系统S^*

3.4.5 抗体的表达

3.4.6 亲合度与浓度的计算

3.4.7 杂交和变异

3.4.8 实验研究

3.5 本章小节

第4章决策系统属性约简

4.1 引言

4.2 属性约简的一个例子与相关基本概念

4.3 现有几种典型的属性约简算法及其分析

4.3.1 基于依赖度的算法

4.3.2 基于分类质量的算法

4.3.3 基于信息熵的算法

4.3.4 基于差别矩阵中属性频率的算法

4.3.5 算法分析

4.4 属性约简的一种新启发式算法

4.4.1 属性重要性度量方法

4.4.2 基于互信息增益率的启发式算法

4.4.3 算法分析

4.4.4 实验结果及相关比较

4.5 本章小节

第5章决策规则获取

5.1 引言

5.2 几种决策规则获取算法

5.2.1 一般值约简算法

5.2.2 归纳值约简算法

5.2.3 基于决策矩阵的值约简算法

5.2.4 缺省规则获取算法

5.2.5 基于分类一致性的规则获取算法RICCR

5.3 处理不一致决策系统的算法

5.3.1 算法描述

5.3.2 算法示例说明

5.3.3 实验研究

5.4 本章小节

第6章全文总结

参考文献

攻读博士学位期间主要的研究成果

致谢

作者简历

基于粗糙集理论的知识发现方法研究

论文摘要

论文目录

相关论文文献

猜你喜欢