基于粗糙集的决策树算法研究及在CRM中的应用

基于粗糙集的决策树算法研究及在CRM中的应用

论文摘要

数据挖掘是一种能够从海量数据中提取有价值信息的技术。它可用于发现隐藏在数据中的聚类模式、关联模式、分类模式等,以辅助人们决策。其中,分类是数据挖掘的一项重要任务,而决策树就是一种能有效用于数据分类的方法。决策树结构简单、容易产生规则、易于理解,在实际中应用极为广泛。首先,本文基于粗糙集理论改进决策树算法。先利用粗糙集理论进行决策表的属性约简,再进行基于粗糙集的决策树构建。经典粗糙集存在着处理噪声数据能力差的不足。为此,本文基于变精度粗糙集的思想对蒋芸博士等(2004)提出的决策树算法进行改进,提出变精度加权平均粗糙度的决策树构造算法。实验结果表明改进后算法构造的决策树结构简洁,泛化能力更强。其次,本文还将提出基于属性区分度的决策树构造算法。其主要思想是决策树的每一次分枝都尽可能使属于不同决策类的数据分开,而使属于同一决策类的数据集中在一起。同样,仿真实验结果表明该算法在多数数据集上构造的决策树比经典的ID3算法要好。最后,本文以电信业客户关系管理(CRM)为背景,基于数据挖掘的基本流程,在一个电信客户流失数据集上分别以ID3算法以及本文改进和提出的决策树算法构建一个客户流失预警模型。模型结果比较表明后两者构建的模型均优于前者。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 选题的背景和意义
  • 1.2 研究的历史和现状
  • 1.3 论文的组织结构
  • 第2章 数据挖掘与客户关系管理
  • 2.1 数据挖掘理论
  • 2.1.1 数据挖掘的概念
  • 2.1.2 数据挖掘的过程
  • 2.1.3 数据挖掘的任务及技术
  • 2.2 客户关系管理(CRM)
  • 2.3 数据挖掘在客户关系管理中的应用
  • 2.4 本章小结
  • 第3章 相关理论介绍
  • 3.1 粗糙集理论
  • 3.1.1 知识与不可区分关系
  • 3.1.2 信息系统与决策表
  • 3.1.3 上下近似与粗糙集
  • 3.1.4 属性约简与属性依赖
  • 3.2 决策树理论
  • 3.2.1 决策树的生成
  • 3.2.2 决策树的剪枝
  • 3.2.3 决策树的评价
  • 3.2.4 基于信息熵的ID3算法
  • 3.3 本章小结
  • 第4章 基于粗糙集的决策树构造算法改进
  • 4.1 引言
  • 4.2 测试属性约简
  • 4.2.1 新决策表形式
  • 4.2.2 新决策表属性重要度代数表示
  • 4.2.3 新决策表属性约简算法
  • 4.2.4 决策表属性约简算例
  • 4.3 WMR算法及分析
  • 4.4 变精度粗糙集模型
  • 4.5 基于变精度粗集的决策树改进方法
  • 4.5.1 属性选择原理
  • 4.5.2 VWMR算法描述
  • 4.5.3 算例对比
  • 4.6 仿真实验
  • 4.7 本章小结
  • 第5章 一种基于属性区分度决策树构造算法
  • 5.1 引言
  • 5.2 属性选择原理
  • 5.3 算法描述
  • 5.4 简单算例
  • 5.5 仿真实验
  • 5.6 本章小结
  • 第6章 决策树在电信客户流失管理中的应用
  • 6.1 电信业客户流失分析的意义
  • 6.2 电信业客户流失建模实例
  • 6.2.1 分析目的
  • 6.2.2 电信数据描述
  • 6.2.3 数据理解和准备
  • 6.2.4 建立模型
  • 6.2.5 模型评估与解释
  • 6.3 本章小结
  • 结束语
  • 参考文献
  • 致谢
  • 在学期间发表的学术论文与研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于粗糙集的决策树算法研究及在CRM中的应用
    下载Doc文档

    猜你喜欢