论文摘要
随着数据挖掘技术的发展,数据挖掘的重要性已经被越来越多的人认可。它是利用已知的数据,通过建立数学模型的方法找出隐含的业务规则。在国外,很多的行业已经具有成功的应用;在国内,随着对数据挖掘技术的重视,数据挖掘技术的应用研究也越来越广,其中对电信行业的客户流失分析就是一大热点。本论文主要研究数据挖掘中的决策树,神经网络以及Logistic回归算法具体在电信业客户流失分析中的应用。首先,从电信企业的实际情况出发,分析探讨了电信企业运用数据挖掘的重要性。其次,介绍了数据挖掘的理论及相关算法,并对所采用的这三种算法作了详细的描述。之后,对本文所采用的数据挖掘软件SPSS-Clementine作了简单的说明。最后,以某电信公司的数据为依托,以CRISPDM(Cross-industry Process for Data Mining)方法论为建模过程框架,按照商业理解,数据准备,建立模型,模型评估,模型发布的步骤建立客户流失预测模型,在建模过程中对三种算法的效率和精度进行分析和对比。在此基础上,选择评估指标较好的算法构建电信客户流失预测模型,并结合预测系统的自身特点,给出电信企业客户流失预测的解决方案。本文把数据挖掘理论与某电信公司数据相结合,最终实现了将预测系统应用于流失客户的识别。应用结果表明所建立的预测模型是科学的,基本上符合实际情况,能够给决策人员提供必要的预测信息并给出解决方案,该预测模型对解决电信客户流失行为预测方面的问题具有重要意义。