基于信息熵的数据约简算法

基于信息熵的数据约简算法

论文摘要

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,而大量激增的数据背后隐藏着许多重要的信息。数据挖掘,就是从大量数据中提取或“挖掘”隐含的、事先未知的、潜在有用的信息。粗糙集理论是一种新的处理模糊和不确定知识的数学工具。该理论的特点是不需要任何先验知识,或任何附加信息,能有效地分析和处理不精确、不完整和不一致等各种不完备信息,并从中发现隐含知识,揭示潜在规律。它是一种新的数据挖掘技术。属性约简是粗糙集理论的核心内容之一。本文把信息熵理论中的互信息作为启发信息,得出两种新的属性约简算法。第一个算法是以互信息作为启发信息,对于能够直接决策的对象直接列出决策结果,然后再对其余的对象进行决策,这样做减少了不必要的重复。这里注意的是同一路径上的属性是不能重复的,这也是决策树的一种剪枝方法。第二个算法以空集作为约简的起点开始搜索,采用回溯的分析方法,减少了搜索空间,提高了算法的效率。这两种算法都可以减小搜索的次数,从而减少了搜索空间。最后分别用实例验证了这两种算法的正确性和高效性。经典的粗糙集理论主要用于离散特征值的情形,信息熵也主要用于离散值信息系统,而实际的数据不仅有离散的也有连续的情形。最后介绍了模糊粗糙集信息熵的基本理论,并将其应用到连续值评估模型中,提出了一种基于模糊熵的评估模型的属性约简算法,并且用实例验证了算法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景与意义
  • 1.2 粗糙集的研究现状及在数据挖掘中的应用现状
  • 1.3 论文内容及结构介绍
  • 第2章 数据挖掘概述
  • 2.1 数据挖掘与知识发现的概述
  • 2.2 数据挖掘的定义
  • 2.2.1 数据挖掘的技术定义
  • 2.2.2 数据挖掘的商业定义
  • 2.3 数据挖掘的过程
  • 2.4 数据挖掘分类方法
  • 2.5 数据挖掘常用工具
  • 2.6 本章小结
  • 第3章 粗糙集理论基础
  • 3.1 粗糙集理论基本概念
  • 3.2 信息系统理论基本概念
  • 3.3 本章小结
  • 第4章 几种常见的约简算法
  • 4.1 几种常见的约简算法
  • 4.1.1 一般约简算法
  • 4.1.2 值约简算法
  • 4.1.3 基于可辨识矩阵的基本属性约简算法
  • 4.1.4 基于可辨识矩阵的属性频度约简算法
  • 4.2 基于可辨识矩阵的约简算法的改进算法
  • 4.2.1 对算法4.4的分析
  • 4.2.2 基于可辨识矩阵的改进算法
  • 4.2.3 实例分析
  • 4.3 本章小结
  • 第5章 基于信息熵的约简算法
  • 5.1 信息熵基础知识
  • 5.2 基于互信息的相对约简算法
  • 5.3 基于信息熵与决策树的规则提取算法
  • 5.3.1 决策树
  • 5.3.2 基于互信息与决策树的规则提取算法
  • 5.3.3 实例分析
  • 5.4 基于信息熵和回溯算法的约简算法
  • 5.4.1 回溯算法的主要思想
  • 5.4.2 算法具体步骤及程序
  • 5.4.3 实例分析
  • 5.5 本章小结
  • 第6章 基于模糊熵的评估模型的属性约简
  • 6.1 模糊粗糙集的基本概念
  • 6.2 模糊粗糙集的信息熵
  • 6.3 评估决策的基本思想
  • 6.4 基于模糊熵的评估模型的属性约简
  • 6.5 实例分析
  • 6.6 本章小结
  • 第7章 结论与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于改进主成分分析法的特征约简算法研究[J]. 安徽职业技术学院学报 2020(02)
    • [2].云计算下保持边界域划分的知识约简算法研究[J]. 计算机工程与应用 2015(24)
    • [3].信息系统的最大可能约简算法[J]. 洛阳师范学院学报 2020(02)
    • [4].基于云计算的属性重要度约简算法研究[J]. 洛阳师范学院学报 2014(08)
    • [5].云计算环境下差别矩阵知识约简算法研究[J]. 计算机科学 2011(08)
    • [6].多半径邻域粗糙集改进约简算法[J]. 计算机工程与应用 2017(11)
    • [7].基于素数性质的布尔函数约简算法[J]. 长春工业大学学报(自然科学版) 2008(06)
    • [8].因素空间理论的因素约简算法[J]. 辽宁工程技术大学学报(自然科学版) 2017(02)
    • [9].关于粒度熵的知识约简算法[J]. 无线互联科技 2013(11)
    • [10].基于绝对信息量的覆盖增量约简算法[J]. 模式识别与人工智能 2011(02)
    • [11].基于核心值的改进值约简算法研究[J]. 煤炭技术 2012(02)
    • [12].云计算环境下知识约简算法[J]. 计算机学报 2011(12)
    • [13].基于粗糙集理论的属性值约简算法研究[J]. 计算机与现代化 2008(07)
    • [14].方差辗转的软集参数约简算法[J]. 计算机工程与科学 2020(02)
    • [15].基于粒度熵的知识约简算法应用[J]. 电脑开发与应用 2015(02)
    • [16].基于信息量的完备覆盖约简算法[J]. 计算机科学 2012(10)
    • [17].基于信息观点的约简算法比较[J]. 计算机科学 2011(01)
    • [18].信息系统中的值约简算法研究[J]. 白城师范学院学报 2011(03)
    • [19].一种新的基于属性重要性的粗糙集值约简算法[J]. 电脑知识与技术 2009(22)
    • [20].粗糙集约简算法的研究与实现[J]. 矿业研究与开发 2008(04)
    • [21].基于抽样的随机约简算法[J]. 电脑知识与技术 2017(33)
    • [22].一种基于相对粒度的决策表约简算法[J]. 计算机科学 2009(03)
    • [23].基于不可区分度的启发式快速完备约简算法[J]. 计算机科学 2009(08)
    • [24].一种新的基于区分矩阵的值约简算法[J]. 工业仪表与自动化装置 2014(02)
    • [25].考虑用户偏好的启发式约简算法[J]. 微计算机信息 2010(27)
    • [26].基于决策熵的值约简算法[J]. 南京大学学报(自然科学版) 2010(05)
    • [27].粗糙集值约简算法研究与应用[J]. 决策与信息(财经观察) 2008(10)
    • [28].基于长度约束区分矩阵的约简算法研究[J]. 计算机工程与应用 2008(09)
    • [29].一种基于粗糙集理论的值约简算法[J]. 广西科学院学报 2013(01)
    • [30].基于分辨矩阵的快速完备约简算法[J]. 计算机工程与应用 2008(08)

    标签:;  ;  ;  ;  ;  ;  

    基于信息熵的数据约简算法
    下载Doc文档

    猜你喜欢