论文摘要
数据挖掘是指在数据中发现模式、知识或数据间的关系。分类挖掘是数据挖掘中最活跃、最成熟的研究方向,分类算法又是其中涉及到的关键技术。在各种分类算法中,决策树方法有更易被用户理解、更适合大训练数据集以及不需要处理训练数据集以外的信息等优点,已经得到广泛的研究和应用。但基于信息论的传统的决策树技术也存在缺点:偏向于选择属性值较多的属性、对样本质量依赖性强和被限制在每个结点上只检验单个属性等。为此,本文把粗糙集技术应用到决策树算法中。粗糙集是研究不精确、不确定知识的工具,具有很强的知识获取能力。在研究的过程中,发现以粗糙集为基础的区分价值属性选择判据优于传统的信息熵,可以降低决策树的规模,但是需要两两比较所有对象,时间性能不好。据此,本文提出了H-重要和L-重要两个概念,减少了比较次数,降低了时间开销。为了进一步降低树的规模,克服单变量决策树没有综合考虑属性间的联系等不足,本文用多变量构造算法结合H-重要和L-重要两个概念重新构造决策树。以H-重要集合中的部分属性作为初始的检验属性,对基于区分价值的决策树算法进行了进一步的改进。最后,利用实验对改进的基于区分价值的决策树算法和基于区分价值的多变量决策树算法进行对比分析。实验结果表明,前者降低了算法的时间开销,但是却并没有牺牲决策树分类的准确性,而后者构造的决策树在规模上得到了进一步的缩减,也就是构造了更为简单的决策树,也不失分类的准确性。
论文目录
相关论文文献
- [1].决策树算法在塑料分类中的应用[J]. 塑料科技 2020(06)
- [2].采用信息散布指数的改进决策树算法[J]. 数学的实践与认识 2020(14)
- [3].面向信用评级的有决策树算法研究[J]. 齐齐哈尔大学学报(自然科学版) 2020(04)
- [4].基于决策树算法的心脏病发病预警模型研究[J]. 电脑知识与技术 2020(19)
- [5].决策树算法的研究综述[J]. 现代营销(下旬刊) 2017(01)
- [6].数据挖掘中决策树算法的应用研究[J]. 电脑编程技巧与维护 2017(14)
- [7].面向大数据分析的决策树算法[J]. 信息系统工程 2017(07)
- [8].基于决策树算法的爬虫识别技术[J]. 软件 2017(07)
- [9].面向大数据分析的决策树算法[J]. 计算机科学 2016(S1)
- [10].一种面向大数据分析的快速并行决策树算法[J]. 云南大学学报(自然科学版) 2020(02)
- [11].决策树算法在健康监测设备自动连接中的应用[J]. 自动化与仪表 2020(06)
- [12].基于分布式运算的决策树算法的研究与实现[J]. 南通职业大学学报 2017(01)
- [13].数据挖掘中决策树算法的研究[J]. 世界科技研究与发展 2009(04)
- [14].一种改进的决策树算法研究[J]. 电脑知识与技术 2015(11)
- [15].决策树算法综述[J]. 软件导刊 2015(11)
- [16].一种新的基于粗糙集的概念模糊化决策树算法[J]. 新课程学习(中) 2014(09)
- [17].决策树算法在人才招聘简历筛选中的应用[J]. 企业改革与管理 2020(17)
- [18].决策树算法及其改进[J]. 科技创新导报 2014(12)
- [19].逆向快速决策树算法概要[J]. 计算机应用研究 2011(12)
- [20].基于决策树算法的疾病诊断分析[J]. 中国卫生信息管理杂志 2011(05)
- [21].数据挖掘中的决策树算法比较研究[J]. 中国科技信息 2010(02)
- [22].决策树算法在物流仓储中的研究与应用[J]. 微计算机信息 2010(30)
- [23].决策树算法分析及其在实际应用中的改进[J]. 铜陵学院学报 2010(06)
- [24].决策树算法的比较与应用研究[J]. 华北电力技术 2017(06)
- [25].决策树算法研究[J]. 课程教育研究 2018(48)
- [26].智能模糊决策树算法在英语机器翻译中的应用[J]. 计算机测量与控制 2020(10)
- [27].改进决策树算法的应用研究[J]. 电子科技 2010(09)
- [28].改进的多关系决策树算法[J]. 计算机应用研究 2009(12)
- [29].浅谈数据挖掘中的决策树算法[J]. 福建电脑 2008(11)
- [30].基于决策树算法的水位观测干扰识别模型[J]. 国际地震动态 2019(11)