基于数据挖掘的宽带客户流失预警系统分析与设计

基于数据挖掘的宽带客户流失预警系统分析与设计

论文摘要

随着电信运营商重组完成以及3G牌照的下发,电信市场竞争日益激烈。三大运营商从传统单一的移动或固网业务运营转变为全业务运营,而宽带业务作为重点业务成为电信运营商全业务竞争中不可或缺的重要阵地。然而,随着宽带业务的激烈竞争,宽带客户的流失问题日益严重。如何更好的及时发现、挽留即将流失的宽带用户成为运营商亟需解决的问题。本项目基于行业标准数据挖掘过程模型CRISP-DM,经过与A地市业务人员及专家的交流探讨,确定从A地市EDW系统以及CRM、计费等业务系统中抽取海量宽带用户状态属性以及行为属性数据。基于海量用户数据,首先构建初步的宽带用户宽表,利用人工构造衍生变量方法实现对于宽带用户属性的完善;利用SPSS Clementine数据挖掘工具实现对于宽带样本数据的审核;通过关联规则分析以及相关系数法实现对于宽带用户属性规约;基于关联规则实现对于宽带用户的空缺值填充;对用于建模的宽带客户样本进行非平衡分布处理,选择决策树C5.0算法,实现宽带流失用户建模;利用测试样本数据对于建立模型进行效果检验,判断模型优劣。最后实现模型发布,应用于A地市一线业务人员营销、宽带客户保有中去。通过利用数据挖掘技术在A地市宽带客户流失挖掘预警项目中的应用,每月为一线业务人员提供宽带客户流失预警名单,使一线业务人员更好的进行针对性营销,进而成功实现了将A地市宽带客户流失率显著降低的目标。解决了A地市宽带客户流失严重的问题,同时也验证了基于数据挖掘技术的宽带客户流失预警是有效的。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 课题背景
  • 1.1.1 电信宽带市场发展现状
  • 1.1.2 数据挖掘在电信行业应用
  • 1.2 课题任务
  • 1.2.1 课题内容
  • 1.2.2 课题研究方法
  • 1.2.3 本人承担任务
  • 1.3 论文结构
  • 第二章 数据挖掘相关理论知识概述
  • 2.1 数据挖掘的体系结构与过程模型
  • 2.1.1 数据挖掘体系结构
  • 2.1.2 数据挖掘过程模型
  • 2.2 数据挖掘相关算法及工具
  • 2.2.1 决策树算法
  • 2.2.2 数据挖掘工具——SPSS Clementine
  • 2.3 本章小结
  • 第三章 系统总体方案
  • 3.1 系统总体说明
  • 3.2 系统定位
  • 3.3 系统开发实施步骤
  • 3.4 数据挖掘工具及算法选择
  • 3.4.1 数据挖掘算法选择
  • 3.4.2 数据挖掘工具选择
  • 3.5 本章小结
  • 第四章 业务理解
  • 4.1 宽带业务发展现状及目标
  • 4.1.1 A地市宽带业务发展现状
  • 4.1.2 A地市宽带业务发展目标
  • 4.2 制定数据挖掘项目目标
  • 4.3 数据挖掘用户范围
  • 4.4 确定数据挖掘数据源
  • 4.4.1 A地市数据源系统介绍
  • 4.4.2 确定数据挖掘数据源
  • 4.5 制定数据挖掘项目计划
  • 4.7 本章小结
  • 第五章 数据理解及准备
  • 5.1 数据获取
  • 5.2 用户宽表构建
  • 5.3 宽带用户衍生变量构造及样本审核
  • 5.3.1 构造宽带用户衍生变量
  • 5.3.2 宽带用户样本审核
  • 5.4 宽带用户属性规约
  • 5.4.1 人工属性探索
  • 5.4.2 基于关联规则的非数值型属性规约
  • 5.4.3 数值型属性规约
  • 5.4.4 缺失数据处理
  • 5.5 样本数据非平衡分布处理
  • 5.5.1 样本非平衡分布现状及原因分析
  • 5.5.2 样本非平衡分布解决方法
  • 5.6 本章小结
  • 第六章 基于决策树C5.0算法的模型建立及评估
  • 6.1 基于决策树C5.0算法的模型建立
  • 6.2 模型评估
  • 6.3 本章小结
  • 第七章 模型发布及应用
  • 7.1 模型发布及应用
  • 7.2 模型应用效果
  • 7.3 本章小结
  • 第八章 结束语
  • 8.1 论文工作总结
  • 8.2 问题和展望
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    基于数据挖掘的宽带客户流失预警系统分析与设计
    下载Doc文档

    猜你喜欢