基于决策树的数据挖掘算法研究与应用

基于决策树的数据挖掘算法研究与应用

论文摘要

数据挖掘是信息处理领域的一项重要课题,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。分类是数据挖掘的重要功能之一,基于决策树的分类算法在数据挖掘中的应用是非常广泛的。与其他分类算法相比,决策树具有计算量相对较小、易于提取显式规则、可以显示重要的决策属性和分类准确率较高等优点。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、生成树的规模较大等。因此,进一步改进决策树算法,提高决策树的性能,使其更加适合数据挖掘技术的应用要求具有重要的理论和实际意义。针对上述不足,本文进行了深入的研究,将粗糙集理论引入决策树分类当中,对如何优化决策树分类算法进行了探索。本文主要研究工作如下:首先,论文介绍了数据挖掘的相关技术和理论基础,并重点对决策树生成及后剪枝算法进行了分析和比较。其次,从属性约简和剪枝两方面对决策树算法进行优化,提出了基于属性依赖度的属性约简算法ER和基于粗糙集理论的决策树后剪枝算法Prune。最后,将优化的决策树算法应用于供应商评价系统当中,并将该算法与C4.5算法作了比较,验证了该算法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第一章 前言
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 主要研究内容
  • 1.4 本文的组织结构
  • 第二章 数据挖掘相关技术研究
  • 2.1 数据挖掘技术
  • 2.1.1 数据挖掘概念
  • 2.1.2 数据挖掘步骤
  • 2.1.3 数据挖掘功能
  • 2.1.4 数据挖掘常用技术
  • 2.2 决策树技术
  • 2.2.1 决策树简介
  • 2.2.2 常见的决策树分类算法
  • 2.2.3 决策树后剪枝方法
  • 2.2.4 决策树方法主要研究内容
  • 2.3 本章小结
  • 第三章 基于粗糙集合的决策树优化研究
  • 3.1 粗糙集理论
  • 3.1.1 粗糙集的基本理论
  • 3.1.2 粗糙集理论的应用
  • 3.2 决策树测试属性约简方法的改进
  • 3.2.1 粗糙集中常用属性约简算法
  • 3.2.2 基于属性依赖度的约简改进算法
  • 3.2.3 算法分析
  • 3.2.4 实例分析
  • 3.2.5 UCI数据集测试
  • 3.3 决策树后剪枝方法的改进
  • 3.3.1 常用后剪枝算法
  • 3.3.2 基于粗糙集理论的后剪枝改进算法
  • 3.3.3 算法分析
  • 3.3.4 实例分析
  • 3.3.5 标准数据集测试
  • 3.4 本章小结
  • 第四章 优化算法在供应商评价系统中的应用
  • 4.1 系统总体构架
  • 4.2 供应商评价模型建立过程
  • 4.2.1 问题定义
  • 4.2.2 数据选择
  • 4.2.3 数据预处理
  • 4.2.4 建立模型
  • 4.2.5 模型评估
  • 4.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间取得的学术成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于决策树的数据挖掘算法研究与应用
    下载Doc文档

    猜你喜欢