基于粗糙集的决策树算法研究与改进

基于粗糙集的决策树算法研究与改进

论文摘要

数据挖掘是指在数据中发现模式、知识或数据间的关系。分类挖掘是数据挖掘中最活跃、最成熟的研究方向,分类算法又是其中涉及到的关键技术。在各种分类算法中,决策树方法有更易被用户理解、更适合大训练数据集以及不需要处理训练数据集以外的信息等优点,已经得到广泛的研究和应用。但基于信息论的传统的决策树技术也存在缺点:偏向于选择属性值较多的属性、对样本质量依赖性强和被限制在每个结点上只检验单个属性等。为此,本文把粗糙集技术应用到决策树算法中。粗糙集是研究不精确、不确定知识的工具,具有很强的知识获取能力。在研究的过程中,发现以粗糙集为基础的区分价值属性选择判据优于传统的信息熵,可以降低决策树的规模,但是需要两两比较所有对象,时间性能不好。据此,本文提出了H-重要和L-重要两个概念,减少了比较次数,降低了时间开销。为了进一步降低树的规模,克服单变量决策树没有综合考虑属性间的联系等不足,本文用多变量构造算法结合H-重要和L-重要两个概念重新构造决策树。以H-重要集合中的部分属性作为初始的检验属性,对基于区分价值的决策树算法进行了进一步的改进。最后,利用实验对改进的基于区分价值的决策树算法和基于区分价值的多变量决策树算法进行对比分析。实验结果表明,前者降低了算法的时间开销,但是却并没有牺牲决策树分类的准确性,而后者构造的决策树在规模上得到了进一步的缩减,也就是构造了更为简单的决策树,也不失分类的准确性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究历史与现状
  • 1.2.1 决策树研究历史与现状
  • 1.2.2 粗糙集研究历史与现状
  • 1.3 分类综述
  • 1.3.1 分类的定义
  • 1.3.2 分类的主要算法
  • 1.4 研究内容及论文结构
  • 第2章 决策树方法
  • 2.1 决策树构建
  • 2.2 决策树修剪
  • 2.2.1 剪枝方法
  • 2.2.2 剪枝策略
  • 2.3 经典的决策树算法
  • 2.4 本章小结
  • 第3章 粗糙集技术
  • 3.1 粗糙集理论的基本概念
  • 3.1.1 不可分辨关系
  • 3.1.2 上近似和下近似
  • 3.1.3 属性的依赖度
  • 3.1.4 属性重要度
  • 3.2 粗糙集的化简
  • 3.2.1 属性的化简
  • 3.2.2 决策表的化简
  • 3.3 本章小结
  • 第4章 基于粗糙集的决策树研究
  • 4.1 基于粗糙集的决策树算法研究
  • 4.1.1 基于粗糙集明确区的决策树算法
  • 4.1.2 基于区分价值的决策树算法
  • 4.2 改进的基于区分价值的决策树算法
  • 4.2.1 算法设计思想
  • 4.2.2 算法正确性分析
  • 4.2.3 决策树算法实例比较
  • 4.3 基于区分价值的多变量决策树构造
  • 4.3.1 属性选择标准重定义
  • 4.3.2 相对泛化的定义
  • 4.3.3 结合区分价值的多变量决策树的构造
  • 4.3.4 实例分析比较
  • 4.4 本章小结
  • 第5章 实验结果与分析
  • 5.1 实验数据来源
  • 5.2 实验结果比较分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].决策树算法在塑料分类中的应用[J]. 塑料科技 2020(06)
    • [2].采用信息散布指数的改进决策树算法[J]. 数学的实践与认识 2020(14)
    • [3].面向信用评级的有决策树算法研究[J]. 齐齐哈尔大学学报(自然科学版) 2020(04)
    • [4].基于决策树算法的心脏病发病预警模型研究[J]. 电脑知识与技术 2020(19)
    • [5].决策树算法的研究综述[J]. 现代营销(下旬刊) 2017(01)
    • [6].数据挖掘中决策树算法的应用研究[J]. 电脑编程技巧与维护 2017(14)
    • [7].面向大数据分析的决策树算法[J]. 信息系统工程 2017(07)
    • [8].基于决策树算法的爬虫识别技术[J]. 软件 2017(07)
    • [9].面向大数据分析的决策树算法[J]. 计算机科学 2016(S1)
    • [10].一种面向大数据分析的快速并行决策树算法[J]. 云南大学学报(自然科学版) 2020(02)
    • [11].决策树算法在健康监测设备自动连接中的应用[J]. 自动化与仪表 2020(06)
    • [12].基于分布式运算的决策树算法的研究与实现[J]. 南通职业大学学报 2017(01)
    • [13].数据挖掘中决策树算法的研究[J]. 世界科技研究与发展 2009(04)
    • [14].一种改进的决策树算法研究[J]. 电脑知识与技术 2015(11)
    • [15].决策树算法综述[J]. 软件导刊 2015(11)
    • [16].一种新的基于粗糙集的概念模糊化决策树算法[J]. 新课程学习(中) 2014(09)
    • [17].决策树算法在人才招聘简历筛选中的应用[J]. 企业改革与管理 2020(17)
    • [18].决策树算法及其改进[J]. 科技创新导报 2014(12)
    • [19].逆向快速决策树算法概要[J]. 计算机应用研究 2011(12)
    • [20].基于决策树算法的疾病诊断分析[J]. 中国卫生信息管理杂志 2011(05)
    • [21].数据挖掘中的决策树算法比较研究[J]. 中国科技信息 2010(02)
    • [22].决策树算法在物流仓储中的研究与应用[J]. 微计算机信息 2010(30)
    • [23].决策树算法分析及其在实际应用中的改进[J]. 铜陵学院学报 2010(06)
    • [24].决策树算法的比较与应用研究[J]. 华北电力技术 2017(06)
    • [25].决策树算法研究[J]. 课程教育研究 2018(48)
    • [26].智能模糊决策树算法在英语机器翻译中的应用[J]. 计算机测量与控制 2020(10)
    • [27].改进决策树算法的应用研究[J]. 电子科技 2010(09)
    • [28].改进的多关系决策树算法[J]. 计算机应用研究 2009(12)
    • [29].浅谈数据挖掘中的决策树算法[J]. 福建电脑 2008(11)
    • [30].基于决策树算法的水位观测干扰识别模型[J]. 国际地震动态 2019(11)

    标签:;  ;  ;  ;  

    基于粗糙集的决策树算法研究与改进
    下载Doc文档

    猜你喜欢