一种改进的属性离散化方法

一种改进的属性离散化方法

论文摘要

属性离散化问题对于很多机器学习算法而言是必需的。对于粗糙集理论而言,属性离散化一直是亟待解决的关键问题之一。本文在分析当前研究中常用的属性离散化方法的基础上,实现了一种计算初始断点集合的算法,该算法在保证决策表的分辨关系的同时减少了初始断点集合的基数;然后定义了断点的信息熵,并以此作为对断点重要性的度量,实现了一种基于粗糙集理论和信息熵的属性离散化算法,该算法在保证决策表的相容度不变的同时还考虑了由连续条件属性和离散条件属性构成的混合决策表;最后,通过与其它离散化算法的对比实验,验证了本文算法的有效性,而且在断点个数增多时仍有很高的计算效率。

论文目录

  • 内容提要
  • 第一章 引言
  • 1.1 本文的研究背景介绍
  • 1.2 相关工作
  • 1.3 本文所做的工作
  • 第二章 粗糙集理论和信息熵理论
  • 2.1 粗糙集理论背景介绍
  • 2.2 粗糙集理论基本定义
  • 2.3 粗糙集的一个实例
  • 2.4 粗糙集理论的应用
  • 2.4.1 人工神经网络训练样本集化简
  • 2.4.2 控制算法获取
  • 2.4.3 决策支持系统
  • 2.4.4 从数据库中发现知识
  • 2.5 信息熵理论
  • 2.5.1 信息熵历史与发展
  • 2.5.2 信息论介绍
  • 2.5.3 信息熵的定义和性质
  • 第三章 粗糙集理论中的连续属性离散化问题
  • 3.1 离散化问题提出
  • 3.2 离散化问题分类
  • 3.3 几种主要的离散化算法介绍
  • 3.3.1 等距离划分与等频率划分算法
  • 3.3.2 NaiveScaler算法
  • 3.3.3 SemiNaiveScaler算法
  • 3.3.4 布尔逻辑和粗糙集理论相结合算法
  • 第四章 基于粗糙集理论和信息熵的属性离散化算法
  • 4.1 基于粗糙集的离散化问题描述
  • 4.2 基于粗糙集理论和信息熵的离散化算法
  • 4.2.1 计算初始断点集合
  • 4.2.2 约简初始断点集合算法
  • 4.2.3 实验结果和分析
  • 第五章 结论和展望
  • 参考文献
  • 摘要
  • ABSTRACT
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    一种改进的属性离散化方法
    下载Doc文档

    猜你喜欢