论文摘要
CRM是一种旨在改善企业与客户之间关系的新型管理机制,它主要实施于企业的市场营销、销售、服务与技术支持等与客户相关的领域,使客户时时感觉到企业的存在,企业随时了解到客户的变化。决策树学习采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较,并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。所以从根到叶结点的一条路径就对应着一条合取规则,整个决策树就对应着一组析取表达式规则。通过决策树算法可以在已有数据模型的基础上得出受益最大的企业解决方案。本文主要研究的是在CRM应用中的决策树算法以及相应的改进算法。在数据挖掘的决策树的算法的研究中,基本的决策树算法有CLS,ID3,CHAID,CART,FACT,SLIQ,SPRINT几种,并且在现有的ID3算法的基础上提出了一种性能更加完善的改进算法―可实现选择最优属性、处理连续型的属性、不必了解相应的属性值的ID3算法。在CRM的实现过程中针对ID3算法以及ID3改进算法,本文分别进行了实现,直观的表达了两种算法下的分类结果。并进一步根据CRM数据研究中常见的数据集在这两个算法下的分类结果对两个算法的性能进行了分析与比较。