论文摘要
属性离散化问题对于很多机器学习算法而言是必需的。对于粗糙集理论而言,属性离散化一直是亟待解决的关键问题之一。本文在分析当前研究中常用的属性离散化方法的基础上,实现了一种计算初始断点集合的算法,该算法在保证决策表的分辨关系的同时减少了初始断点集合的基数;然后定义了断点的信息熵,并以此作为对断点重要性的度量,实现了一种基于粗糙集理论和信息熵的属性离散化算法,该算法在保证决策表的相容度不变的同时还考虑了由连续条件属性和离散条件属性构成的混合决策表;最后,通过与其它离散化算法的对比实验,验证了本文算法的有效性,而且在断点个数增多时仍有很高的计算效率。
论文目录
内容提要第一章 引言1.1 本文的研究背景介绍1.2 相关工作1.3 本文所做的工作第二章 粗糙集理论和信息熵理论2.1 粗糙集理论背景介绍2.2 粗糙集理论基本定义2.3 粗糙集的一个实例2.4 粗糙集理论的应用2.4.1 人工神经网络训练样本集化简2.4.2 控制算法获取2.4.3 决策支持系统2.4.4 从数据库中发现知识2.5 信息熵理论2.5.1 信息熵历史与发展2.5.2 信息论介绍2.5.3 信息熵的定义和性质第三章 粗糙集理论中的连续属性离散化问题3.1 离散化问题提出3.2 离散化问题分类3.3 几种主要的离散化算法介绍3.3.1 等距离划分与等频率划分算法3.3.2 NaiveScaler算法3.3.3 SemiNaiveScaler算法3.3.4 布尔逻辑和粗糙集理论相结合算法第四章 基于粗糙集理论和信息熵的属性离散化算法4.1 基于粗糙集的离散化问题描述4.2 基于粗糙集理论和信息熵的离散化算法4.2.1 计算初始断点集合4.2.2 约简初始断点集合算法4.2.3 实验结果和分析第五章 结论和展望参考文献摘要ABSTRACT致谢
相关论文文献
标签:粗糙集论文; 离散化论文; 信息熵论文; 断点重要性论文;