基于知识粗糙度和拓展属性约简的若干智能挖掘算法的研究

基于知识粗糙度和拓展属性约简的若干智能挖掘算法的研究

论文摘要

粗糙集理论是研究不完整、不确定问题的一种有效的方法,它具有不需要先验知识,忠实于原始数据的优点。在数据挖掘与数据库知识发现领域,粗糙集理论与方法已经得到了大量成功的应用,并已经成为数据挖掘与数据库知识发现的主流方法之一。 经典的粗糙集的方法针对的是确定性的信息系统,很多算法也是基于这样的假设。但是在实际的应用中,由于种种原因,我们得到的数据都带有一定的不完备性和不确定性,对于这样的问题,经典的粗糙集学习算法便显得捉襟见肘。于是很多扩展的粗糙集模型便应运而生,如变精度的粗糙集模型、模糊粗糙集模型等等,它们将近似、概率统计的观点引入经典的粗糙集中,定义了新的属性约简、核以及相应的可辨识矩阵,并在一些应用中取得了可喜的成果。 本文先是介绍了一种基于知识粗糙度的多变量决策树的构建算法,它在一些情况下得到的决策树比ID3得到的简单。进一步,本文分析了不一致信息系统下的分布约简、最大分布约简和熵意义下约简的性质和它们之间的关系,得出了熵意义下约简与分布约简等价的结论。同时借助概率统计中的卡方分布,提出了一种衡量属性约简与决策属性的相关性的随机性强弱的方法,为从多个属性约简中选择较好的约简提供了一种参考的原则。 在某些应用的场合下,样本数据是不断的增加或者被修改的,这就要求当有新样本到来的时候,学习算法可以在原来的获得的知识的基础上,增量地学习,而非一概地重新运行挖掘算法。为此,本文基于最大分布约简的可辨识矩阵,提出了一种增量的学习算法,并将其应用于医疗数据的挖掘中,试验的结果说明了算法的正确性和有效性。

论文目录

  • 第一章 引言
  • 1.1 粗糙集理论基础
  • 1.1.2 知识表示系统和决策系统
  • 1.1.3 粗糙集的几个概念
  • 1.2 基于粗糙集的知识发现
  • 1.2.1 知识发现与数据挖掘概述
  • 1.2.2 基于粗糙集的知识发现过程
  • 1.2.2.1 基于粗糙集的知识发现的过程
  • 1.2.2.2 经典的粗糙集方法存在的问题
  • 1.2.2.3 推广的粗糙集理论
  • 1.3 本文的主要工作和创新点
  • 1.3.1 本文的主要工作
  • 1.3.2 本文的创新点
  • 1.4 本文的组织
  • 第二章 属性约简
  • 2.1 属性约简的基本概念
  • 2.2 不一致信息系统的属性约简
  • 2.2.1 分布约简
  • 2.2.2 最大分布约简
  • 2.2.3 熵意义下的约简
  • 2.2.3.1 知识的概率分布
  • 2.2.3.2 知识的熵与条件熵
  • 2.2.3.3 熵意义下的约简
  • 第三章 基于知识粗糙度的多变量决策树
  • 3.1 信息熵与决策树
  • 3.2 多变量决策树
  • 3.3 基于知识粗糙度的多变量决策树的构建
  • 3.3.1 知识的粗糙度
  • 3.3.2 算法流程
  • 3.3.3 实验结果
  • 3.3.3.1 算例执行过程
  • 3.3.3.2 两种方法得到决策树比较
  • 3.3.4 结论
  • 第四章 概率粗糙集方法
  • 4.1 概述
  • 4.2 信息表的不完备性和规则的不确定性
  • 4.2.1 规则的完备性
  • 4.2.2 规则的准确性
  • 4.2.3 规则的偶然性
  • 4.3 卡方分布及变量间的相关度
  • 4.4 基于卡方分布的属性分类能力的度量
  • 4.4.1 知识的概率分布表
  • 4.4.2 变量的相关性强度
  • 第五章 基于粗糙集的增量学习算法
  • 5.1 增量学习算法概述
  • 5.1.1 规则生成算法
  • 5.1.2 求近似最小规则集的算法逻辑描述
  • 5.2 基于最大分布可辨识矩阵的增量学习算法
  • 5.2.1 最大分布可辨识矩阵
  • 5.2.2 二进制最大分布可辨识矩阵
  • 5.2.3 最大分布约简的核
  • 5.2.4 新增数据类型的判定
  • 5.2.5 增量学习算法的流程
  • 5.2.6 规则的更新策略
  • 5.3 实验结果及其分析
  • 5.3.1 源数据的介绍和预处理
  • 5.3.2 提取出的规则和动态的检验
  • 5.3.3 算法的复杂性分析
  • 5.4 总结
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间发表的学术论文
  • 相关论文文献

    • [1].三支决策-基于粗糙集与粒计算研究视角[J]. 智能系统学报 2019(06)
    • [2].多粒度粗糙集近似集的增量方法[J]. 山东大学学报(理学版) 2020(01)
    • [3].《粗糙集理论及其应用》研究生课程教学改革与实践[J]. 闽南师范大学学报(自然科学版) 2020(01)
    • [4].基于粗糙集理论的水利工程现代化管理评价[J]. 黑龙江水利科技 2020(01)
    • [5].基于代数角度的变精度多粒度粗糙集的约简[J]. 咸阳师范学院学报 2020(02)
    • [6].局部广义多粒度粗糙集[J]. 计算机工程与科学 2020(08)
    • [7].可变多粒度粗糙集粒度约简研究[J]. 哈尔滨师范大学自然科学学报 2019(01)
    • [8].基于覆盖粗糙集的超图连通性[J]. 数码设计 2016(02)
    • [9].关系粗糙集的邻域拟阵结构研究[J]. 数码设计 2016(02)
    • [10].基于粒度矩阵的程度多粒度粗糙集粒度约简[J]. 系统工程与电子技术 2016(12)
    • [11].基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J]. 计算机科学 2017(01)
    • [12].优势关系下多粒度粗糙集排序方法及其应用[J]. 计算机工程与应用 2017(01)
    • [13].优势关系多粒度粗糙集中近似集动态更新方法[J]. 中国科学技术大学学报 2017(01)
    • [14].基于加权粒度和优势关系的程度多粒度粗糙集[J]. 山东大学学报(理学版) 2017(03)
    • [15].组合多粒度粗糙集及其在教学评价中的应用[J]. 数码设计 2017(01)
    • [16].基于粗糙集的大学生学习与就业关系分析[J]. 计算机技术与发展 2017(05)
    • [17].粗糙集理论及其应用综述[J]. 物联网技术 2017(06)
    • [18].不完备信息系统中的广义多粒度双相对定量决策粗糙集[J]. 南京大学学报(自然科学) 2017(04)
    • [19].基于可变多粒度概率粗糙集的分类模型[J]. 模式识别与人工智能 2017(08)
    • [20].基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简[J]. 计算机科学 2016(02)
    • [21].可变程度多粒度粗糙集[J]. 小型微型计算机系统 2016(05)
    • [22].粗糙集理论在国内旅游研究中的应用[J]. 旅游纵览(下半月) 2014(14)
    • [23].基于信息量的悲观多粒度粗糙集粒度约简[J]. 南京大学学报(自然科学) 2015(02)
    • [24].粗糙集理论在故障诊断中的应用研究[J]. 科技视界 2015(16)
    • [25].粗糙集理论在输变电工程造价风险评价指标体系优化中的应用[J]. 土木工程与管理学报 2015(04)
    • [26].基于粗糙集理论的多标度层次分析教师教学评价模型[J]. 数学学习与研究 2017(11)
    • [27].基于粗糙集理论和因果图的故障诊断[J]. 重庆师范大学学报(自然科学版) 2020(02)
    • [28].基于粗糙集的高校学生实践能力因素研究[J]. 计算机技术与发展 2020(04)
    • [29].邻域粗糙集属性约简在民族团结进步创建评价中的应用[J]. 信息与电脑(理论版) 2020(12)
    • [30].新型灰狼算法的粗糙集属性约简及应用[J]. 计算机工程与应用 2017(24)

    标签:;  ;  ;  ;  ;  

    基于知识粗糙度和拓展属性约简的若干智能挖掘算法的研究
    下载Doc文档

    猜你喜欢