随机森林在电信行业客户流失预测中的应用

随机森林在电信行业客户流失预测中的应用

论文摘要

随着通讯工具的日益普及,电信行业之间争取客户、扩大市场份额的竞争日益激烈。按照最新电信行业成本结构核算,流失一个已有客户的代价是发展一个新客户所带来利润的5倍。因此在日趋饱和的客户市场中,如何预测客户的流失成为工作的重中之重。电信行业的数据具有海量且随时间递增的特点,而随机森林(RF,RandomForest)能有效地处理大数据集,且具有容噪性较好的特点。因此,本课题将其引入福建移动某地区分公司的客户流失预测中。本文首先利用随机森林算法建立电信行业客户流失预测的初步模型。在原始数据预处理方面,我们利用RF算法定义的异常样本度量尺度来检测异常样本,并通过和其他两种主流异常样本检测方法的对比,来说明随机森林提供的异样样本检测方法的优越性。利用这个方法剔除电信行业客户数据中部分明显异常的样本,然后利用RF算法建立初步的流失预测模型,并与移动经营分析系统自身提供的模型进行对比,证明RF算法的良好性能。本文还利用RF提供的用于衡量样本间相似程度的相似性矩阵(proximitymatrix)进行特征映射,进而得到每个样本基于该矩阵的放缩坐标,并用该坐标来近似表示样本集所包含的信息。结合转导推理思想,本文提出了一种基于随机森林坐标放缩的降维转导方法。对于标准数据库的实验表明,这样的降维转导方法简单有效,并且能够较大程度地表达出样本间信息,是一种良好的维归约方法。在此基础上,通过引入基于马氏距离的超椭球K均值聚类(HCkmean-in-RF)算法,我们进一步改进客户流失预测模型的性能。大量的仿真结果表明,改进的流失预测模型具有较好的预测准确率、以及针对预测结果的部分可解释性。新模型的预测结果可以进行解释分析,能针对不同类型的可能流失客户给出相应的挽留措施,从而有望成为电信行业客户流失预测研究领域的一种强有力的备选方案。

论文目录

  • 摘要
  • Abstract
  • 前言
  • 第一章 电信行业客户流失预测
  • 1.1 选题的背景及意义
  • 1.2 电信行业客户流失预测研究的现状
  • 第二章 分类问题和随机森林算法简介
  • 2.1 分类问题、分类器和分类器组合
  • 2.1.1 分类问题和分类器
  • 2.1.2 分类器组合
  • 2.2 决策树
  • 2.2.1 决策树方法简介
  • 2.2.2 分类回归树(CART)
  • 2.3 Bagging方法
  • 2.4 随机森林
  • 2.4.1 随机森林的定义
  • 2.4.2 随机森林算法
  • 2.4.3 随机森林的泛化误差
  • 2.4.4 OOB估计
  • 2.4.5 随机森林的优点及其应用
  • 第三章 利用随机森林建立流失预测初步模型
  • 3.1 随机森林的进一步研究
  • 3.1.1 流失与流失异常状态
  • 3.1.2 异常样本检测
  • 3.2 数据预处理
  • 3.2.1 数据描述
  • 3.2.2 删除数据集中的异常样本
  • 3.3 建立初步的流失预测模型
  • 3.3.1 RF对不平衡数据的处理方法
  • 3.3.2 RF模型参数的选择
  • 3.3.3 初步的流失预测模型
  • 第四章 基于随机森林的改进流失预测模型
  • 4.1 基于随机森林坐标放缩的维归约
  • 4.1.1 维归约
  • 4.1.2 随机森林框架下的坐标放缩
  • 4.1.3 转导推理
  • 4.1.4 基于随机森林坐标放缩的维归约
  • 4.2 基于随机森林坐标放缩的超椭球 K均值改进算法
  • 4.2.1 改进的超椭球 K均值聚类算法
  • 4.2.2 仿真实验
  • 4.3 基于随机森林的改进流失预测模型
  • 4.4 模型预测结果的部分可解释性
  • 第五章 总结与展望
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于客户细分的客户流失预测研究[J]. 通讯世界 2020(06)
    • [2].客户流失管理研究现状及展望[J]. 计算机系统应用 2017(12)
    • [3].浅谈客户流失[J]. 汽车维修技师 2017(05)
    • [4].客户流失研究综述[J]. 中国商论 2018(32)
    • [5].企业客户流失及对策研究[J]. 企业导报 2015(08)
    • [6].给不重视企业“生命”的药方(5)——客户流失防治方案:如何提供客户流失台账、报表与分析报告[J]. 汽车维修技师 2013(11)
    • [7].美国公司如何避免客户流失[J]. IT时代周刊 2010(11)
    • [8].基于层次分析法的商业零售业客户流失度分析[J]. 市场论坛 2008(05)
    • [9].基于深度置信神经网络的电信客户流失分析[J]. 通讯世界 2020(06)
    • [10].线上会员客户流失的建模与预测研究[J]. 管理现代化 2016(03)
    • [11].电子商务客户流失的建模与预测研究[J]. 计算机仿真 2012(05)
    • [12].你的客户流失了吗?[J]. 中国电信业 2012(06)
    • [13].数据挖掘在证券客户流失管理中的应用[J]. 科技管理研究 2011(10)
    • [14].邮政企业防止大客户流失对策探讨[J]. 邮政研究 2010(01)
    • [15].谈啤酒客户流失风险管理[J]. 啤酒科技 2009(04)
    • [16].基于深度学习的电信客户流失预测方法研究[J]. 电视技术 2020(04)
    • [17].基于自组织模糊规则归纳的电子商务客户流失预测[J]. 计算机应用与软件 2010(12)
    • [18].旅游业客户流失管理方法研究[J]. 商业研究 2008(08)
    • [19].农资企业:客户流失,该打谁的板子?[J]. 中国农资 2015(13)
    • [20].改进支持向量机在电信客户流失预测的应用[J]. 计算机仿真 2011(07)
    • [21].基于决策树技术的铁路货运企业客户流失问题研究[J]. 河南科技 2011(14)
    • [22].基于神经网络集成的电信客户流失预测建模及应用[J]. 大众商务 2010(06)
    • [23].如何保证老客户绝不流失?[J]. 北方牧业 2009(02)
    • [24].自我网络特征对电信客户流失的影响[J]. 管理科学 2017(05)
    • [25].基于决策树的证券客户流失模型[J]. 计算机应用与软件 2009(09)
    • [26].客户流失的五种解决方式[J]. 农化新世纪 2008(02)
    • [27].基于生存分析模型的电信客户流失研究[J]. 福州大学学报(哲学社会科学版) 2018(01)
    • [28].基于大数据分析的企业客户流失研究[J]. 现代国企研究 2015(12)
    • [29].大数据在客户流失预测中的应用研究[J]. 商业故事 2018(21)
    • [30].马年话营销——为什么客户满意度高,而实际客户流失数量也高?(7)[J]. 汽车维修技师 2014(09)

    标签:;  ;  ;  

    随机森林在电信行业客户流失预测中的应用
    下载Doc文档

    猜你喜欢