论文摘要
粗糙集理论是上世纪八十年代初由波兰数学家Z.Pawlak首先提出的一种用于数据分析的数学理论,它能处理含糊性和不精确性问题。自上世纪九十年代起,该理论日益受到重视,并成为国际学术界的研究热点之一。经过二十年的发展,粗糙集理论已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域获得成功应用。本文主要对粗糙集理论在知识发现中应用的关键问题进行了研究。第一章对知识发现进行了概述,介绍了知识发现的基本步骤、基本方法、基本任务等。而后对粗糙集理论进行了概述,介绍了粗糙集理论产生的背景、粗糙集理论的发展、以及对粗糙集应用于知识发现的优点作了阐述。第二章介绍了粗糙集理论的一些基本概念,并将粗糙集与其他几种处理不确定性理论作了比较。第三章对离散化问题进行了研究,从启发式方法和基于遗传算法的方法两个方面进行了研究。通过对初始断点集进行精简,将Nguyen S H提出的著名的离散化算法进行了改进,改进后的算法在空间复杂度和时间复杂度上都有较大程度的降低;另外,提出了一种免疫算法用于求解决策系统的离散化问题,它与启发式算法相比能获得更小且一致的离散化结果,为粗糙集中连续属性离散化提供了一种新的思想。第四章对于决策系统属性约简问题,从信息论角度定义了一种新的属性重要性度量方法。与基于互信息增益的方法不同的是:这种度量方法不仅考虑了属性的值域的大小,而且还考虑了取值的分布。基于此度量,构造了相应的启发式算法,对多个数据集的实验结果表明该方法能更有效地对决策系统进行约简。第五章研究了决策规则的获取,重点是针对不一致决策系统,提出了一种修改的基于分类一致性的规则获取算法,对每个决策类计算出相应的下近似集与上近似集,然后用决策类的下近似集获得确定性规则,上近似集获得概率性规则。在规则获取时采用属性重要性方法,与LEM2相比,它能一次获得多条规则。通过对Hayes数据集的实验表明了算法的有效性。
论文目录
摘要Abstract第1章 绪论1.1 知识发现概述1.1.1 知识发现的概念1.1.2 知识发现的过程1.1.3 知识发现的任务1.1.4 知识发现的方法1.2 粗糙集理论概述1.2.1 粗糙集理论提出的背景1.2.2 粗糙集理论国内外发展现状1.2.3 粗糙集理论及其应用研究现状1.3 知识发现与粗糙集1.4 本文主要内容和组织第2章 粗糙集理论基础2.1 粗糙集的基本概念2.1.1 知识与分类2.1.2 知识的等价与粗细关系2.1.3 信息系统与决策系统2.1.4 上近似、下近似与粗糙集2.1.5 精确性度量2.1.6 划分的近似2.1.7 约简与核2.2 粗糙集与其他不确定性理论的比较2.2.1 粗糙集与模糊集2.2.2 粗糙集与概率统计方法2.2.3 粗糙集与Dempster-Shafer证据理论第3章 决策系统中连续属性的离散化3.1 引言3.2 粗糙集中的离散化问题3.3 一种改进的启发式离散化方法3.3.1 改进算法中初始断点集的确定3.3.2 改进后的启发式算法3.3.3 一个示例3.3.4 实验比较3.4 基于免疫算法的离散化方法3.4.1 免疫算法机理3.4.2 免疫算法的计算流程3.4.3 算法框架*'>3.4.4 初始断点集与构造新决策系统S*3.4.5 抗体的表达3.4.6 亲合度与浓度的计算3.4.7 杂交和变异3.4.8 实验研究3.5 本章小节第4章 决策系统属性约简4.1 引言4.2 属性约简的一个例子与相关基本概念4.3 现有几种典型的属性约简算法及其分析4.3.1 基于依赖度的算法4.3.2 基于分类质量的算法4.3.3 基于信息熵的算法4.3.4 基于差别矩阵中属性频率的算法4.3.5 算法分析4.4 属性约简的一种新启发式算法4.4.1 属性重要性度量方法4.4.2 基于互信息增益率的启发式算法4.4.3 算法分析4.4.4 实验结果及相关比较4.5 本章小节第5章 决策规则获取5.1 引言5.2 几种决策规则获取算法5.2.1 一般值约简算法5.2.2 归纳值约简算法5.2.3 基于决策矩阵的值约简算法5.2.4 缺省规则获取算法5.2.5 基于分类一致性的规则获取算法RICCR5.3 处理不一致决策系统的算法5.3.1 算法描述5.3.2 算法示例说明5.3.3 实验研究5.4 本章小节第6章 全文总结参考文献攻读博士学位期间主要的研究成果致谢作者简历
相关论文文献
标签:粗糙集理论论文; 知识发现论文; 离散化论文; 属性约简论文; 决策规则论文;