论文摘要
随着电信运营商重组完成以及3G牌照的下发,电信市场竞争日益激烈。三大运营商从传统单一的移动或固网业务运营转变为全业务运营,而宽带业务作为重点业务成为电信运营商全业务竞争中不可或缺的重要阵地。然而,随着宽带业务的激烈竞争,宽带客户的流失问题日益严重。如何更好的及时发现、挽留即将流失的宽带用户成为运营商亟需解决的问题。本项目基于行业标准数据挖掘过程模型CRISP-DM,经过与A地市业务人员及专家的交流探讨,确定从A地市EDW系统以及CRM、计费等业务系统中抽取海量宽带用户状态属性以及行为属性数据。基于海量用户数据,首先构建初步的宽带用户宽表,利用人工构造衍生变量方法实现对于宽带用户属性的完善;利用SPSS Clementine数据挖掘工具实现对于宽带样本数据的审核;通过关联规则分析以及相关系数法实现对于宽带用户属性规约;基于关联规则实现对于宽带用户的空缺值填充;对用于建模的宽带客户样本进行非平衡分布处理,选择决策树C5.0算法,实现宽带流失用户建模;利用测试样本数据对于建立模型进行效果检验,判断模型优劣。最后实现模型发布,应用于A地市一线业务人员营销、宽带客户保有中去。通过利用数据挖掘技术在A地市宽带客户流失挖掘预警项目中的应用,每月为一线业务人员提供宽带客户流失预警名单,使一线业务人员更好的进行针对性营销,进而成功实现了将A地市宽带客户流失率显著降低的目标。解决了A地市宽带客户流失严重的问题,同时也验证了基于数据挖掘技术的宽带客户流失预警是有效的。
论文目录
摘要ABSTRACT第一章 引言1.1 课题背景1.1.1 电信宽带市场发展现状1.1.2 数据挖掘在电信行业应用1.2 课题任务1.2.1 课题内容1.2.2 课题研究方法1.2.3 本人承担任务1.3 论文结构第二章 数据挖掘相关理论知识概述2.1 数据挖掘的体系结构与过程模型2.1.1 数据挖掘体系结构2.1.2 数据挖掘过程模型2.2 数据挖掘相关算法及工具2.2.1 决策树算法2.2.2 数据挖掘工具——SPSS Clementine2.3 本章小结第三章 系统总体方案3.1 系统总体说明3.2 系统定位3.3 系统开发实施步骤3.4 数据挖掘工具及算法选择3.4.1 数据挖掘算法选择3.4.2 数据挖掘工具选择3.5 本章小结第四章 业务理解4.1 宽带业务发展现状及目标4.1.1 A地市宽带业务发展现状4.1.2 A地市宽带业务发展目标4.2 制定数据挖掘项目目标4.3 数据挖掘用户范围4.4 确定数据挖掘数据源4.4.1 A地市数据源系统介绍4.4.2 确定数据挖掘数据源4.5 制定数据挖掘项目计划4.7 本章小结第五章 数据理解及准备5.1 数据获取5.2 用户宽表构建5.3 宽带用户衍生变量构造及样本审核5.3.1 构造宽带用户衍生变量5.3.2 宽带用户样本审核5.4 宽带用户属性规约5.4.1 人工属性探索5.4.2 基于关联规则的非数值型属性规约5.4.3 数值型属性规约5.4.4 缺失数据处理5.5 样本数据非平衡分布处理5.5.1 样本非平衡分布现状及原因分析5.5.2 样本非平衡分布解决方法5.6 本章小结第六章 基于决策树C5.0算法的模型建立及评估6.1 基于决策树C5.0算法的模型建立6.2 模型评估6.3 本章小结第七章 模型发布及应用7.1 模型发布及应用7.2 模型应用效果7.3 本章小结第八章 结束语8.1 论文工作总结8.2 问题和展望参考文献致谢
相关论文文献
标签:数据挖掘论文; 宽带客户流失论文; 决策树论文;