论文摘要
粗糙集理论是20世纪80年代初由波兰数学家首先提出的一种刻画不确定和不完备知识的数学工具,能有效地分析和处理不精确、不一致、不完整等各种信息,并从中发现隐含的知识,揭示潜在的规律。经典粗糙集理论以完备系统为研究对象,以等价关系为基础,通过等价关系将论域划分为互不相交的等价类;然而,在现实生活中,由于数据测量的误差,对数据理解或获取的限制等原因,使得在知识获取时往往面临的是不完备系统,即可能存在部分对象的一些属性值未知的情况,这就极大地限制了粗糙集理论向实用化方向发展。因此,如何从不完备决策系统中应用粗糙集理论获取知识己经成为当前的一个重要研究课题。本文首先综述了数据挖掘的原理和现状,从数据挖掘和知识分类的角度出发,探讨了数据挖掘的相关概念、工作步骤和关键技术。深入分析了粗糙集的基本理论以及粗糙集理论在不完备系统中的拓展。然后基于相容关系研究了把信息论和集合论应用于不完备决策系统属性约简的方法,以及粗糙集理论与遗传算法相结合的不完备决策系统属性约简算法,通过实验数据验证所提出的约简算法,得到不完备决策系统相对应的约简结果。接下来研究了在属性约简后的决策表中提取最优规则的算法并通过实例分析验证了算法的正确性。本文最后设计和开发一个基于粗糙集理论的不完备决策系统的数据挖掘模型,应用本文算法进行属性约简和最优规则提取,部分实现该模型的功能。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究的目的和意义1.2 数据挖掘概述1.2.1 数据挖掘的定义1.2.2 数据挖掘的目的1.2.3 数据挖掘的方法1.2.4 数据挖掘的步骤1.2.5 数据挖掘发展概述1.3 粗糙集理论概述1.4 不完备信息处理的研究现状及分析1.5 本文的工作1.6 本文的组织第二章 粗糙集理论2.1 知识分类2.2 信息系统与决策表2.2.1 信息系统2.2.2 决策表2.3 不精确范畴,粗糙集与上、下近似集2.4 近似分类和近似分类质量2.5 知识的依赖性与知识约简2.5.1 信息系统的知识约简2.5.2 决策表的知识约简2.5.3 知识依赖度与分类精度2.5.4 信息论观点与条件熵2.5.5 决策规则与确定性因子2.6 本章小结第三章 不完备系统中的粗糙集理论3.1 不完备信息3.1.1 空值定义及产生原因3.1.2 空值的常见处理方法3.2 不完备系统中的粗糙集模型拓展3.2.1 相容关系3.2.2 相似关系3.2.3 一般二元关系3.3 不完备系统的知识约简3.3.1 广义决策函数3.3.2 属性约简和广义决策函数3.3.3 区分函数3.4 本章小结第四章 基于条件信息熵的不完备决策表属性约简4.1 概述4.2 相容关系下知识的信息熵与条件信息量度量4.3 属性重要性的信息量表示4.4 基于条件信息量的属性约简算法4.5 基于条件信息熵的属性约简算法4.6 实例分析4.7 本章小结第五章 基于遗传算法的不完备决策表属性约简5.1 概述5.2 遗传算法基本原理5.3 遗传算法参数选择及基本操作5.3.1 种群规模5.3.2 适应度函数5.3.3 选择操作5.3.4 交叉操作5.3.5 变异操作5.4 基于遗传算法的不完备决策表属性约简算法5.4.1 编码机制5.4.2 适应度函数设计5.4.3 选择算子设计5.4.4 改进的自适应交叉算子与变异算子5.4.5 最优个体保存5.4.6 算法终止条件5.4.7 算法描述5.5 实例分析5.6 本章小结第六章 不完备决策系统的最优规则提取6.1 基本概念6.2 算法描述6.3 实例分析6.4 本章小结第七章 不完备决策系统的数据挖掘模型7.1 引言7.2 数据挖掘模型的系统设计7.3 模块功能简介7.3.1 数据预处理模块7.3.2 属性约简模块7.3.3 规则提取模块7.4 数据挖掘模型的流程图7.5 本章小结第八章 结论与展望8.1 主要工作及创新点8.2 展望参考文献致谢附录A(攻读硕士学位期间发表录用的论文)详细摘要
相关论文文献
标签:数据挖掘论文; 不完备决策系统论文; 粗糙集论文; 属性约简论文; 条件信息熵论文; 遗传算法论文; 规则提取论文;