论文摘要
数据挖掘是信息处理领域的一项重要课题,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。分类是数据挖掘的重要功能之一,基于决策树的分类算法在数据挖掘中的应用是非常广泛的。与其他分类算法相比,决策树具有计算量相对较小、易于提取显式规则、可以显示重要的决策属性和分类准确率较高等优点。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、生成树的规模较大等。因此,进一步改进决策树算法,提高决策树的性能,使其更加适合数据挖掘技术的应用要求具有重要的理论和实际意义。针对上述不足,本文进行了深入的研究,将粗糙集理论引入决策树分类当中,对如何优化决策树分类算法进行了探索。本文主要研究工作如下:首先,论文介绍了数据挖掘的相关技术和理论基础,并重点对决策树生成及后剪枝算法进行了分析和比较。其次,从属性约简和剪枝两方面对决策树算法进行优化,提出了基于属性依赖度的属性约简算法ER和基于粗糙集理论的决策树后剪枝算法Prune。最后,将优化的决策树算法应用于供应商评价系统当中,并将该算法与C4.5算法作了比较,验证了该算法的有效性。
论文目录
摘要Abstract第一章 前言1.1 研究背景及意义1.2 国内外研究现状1.2.1 国外研究现状1.2.2 国内研究现状1.3 主要研究内容1.4 本文的组织结构第二章 数据挖掘相关技术研究2.1 数据挖掘技术2.1.1 数据挖掘概念2.1.2 数据挖掘步骤2.1.3 数据挖掘功能2.1.4 数据挖掘常用技术2.2 决策树技术2.2.1 决策树简介2.2.2 常见的决策树分类算法2.2.3 决策树后剪枝方法2.2.4 决策树方法主要研究内容2.3 本章小结第三章 基于粗糙集合的决策树优化研究3.1 粗糙集理论3.1.1 粗糙集的基本理论3.1.2 粗糙集理论的应用3.2 决策树测试属性约简方法的改进3.2.1 粗糙集中常用属性约简算法3.2.2 基于属性依赖度的约简改进算法3.2.3 算法分析3.2.4 实例分析3.2.5 UCI数据集测试3.3 决策树后剪枝方法的改进3.3.1 常用后剪枝算法3.3.2 基于粗糙集理论的后剪枝改进算法3.3.3 算法分析3.3.4 实例分析3.3.5 标准数据集测试3.4 本章小结第四章 优化算法在供应商评价系统中的应用4.1 系统总体构架4.2 供应商评价模型建立过程4.2.1 问题定义4.2.2 数据选择4.2.3 数据预处理4.2.4 建立模型4.2.5 模型评估4.3 本章小结结论参考文献攻读硕士学位期间取得的学术成果致谢
相关论文文献
标签:数据挖掘论文; 分类论文; 决策树论文; 粗糙集理论论文;