基于集成代价敏感分类方法的客户流失预测研究

基于集成代价敏感分类方法的客户流失预测研究

论文摘要

以客户为中心的经营管理理念,已成为当前企业发展的基石,以此为特征的客户关系管理技术,已经成为企业获取竞争优势的重要手段。客户流失分析是客户关系管理的重要组成部分。研究表明,若能有效地降低客户流失率,将能够极大提升企业的竞争力以及盈利水平。因此在全球市场竞争日益激烈的今天,找出客户流失缘由、降低客户流失率,是具有重要理论意义和现实意义的研究课题。论文首先回顾了客户流失的基本概念,以及客户流失问题的研究途径,同时分析了传统数据挖掘分类方法在客户流失预测中的不足。接着,阐述了常用的数据挖掘分类方法,重点是决策树和支持向量机方法,为后文提出的改进算法做了理论铺垫。接下来,针对传统分类方法在分类过程中假设所有分类错误的错分代价是相等的局限,引入代价敏感学习机制,阐述了为传统分类方法引入代价敏感学习的两种思路。最后,就传统分类方法的泛化能力较弱的局限,阐述了通过引入集成学习以解决传统分类方法构建单一分类器的不稳定性,以及提高其学习精度,达到有效地提高传统分类方法泛化能力的目的。然后,论文以决策树C4.5算法和支持向量机方法作为基准算法,通过引入代价敏感学习,分别对两种传统分类方法进行了代价敏感改造,再利用经典的集成算法Boosting和Bagging对两者进行集成学习,从而提出了基于Boosting与代价敏感决策树和基于Bagging与代价敏感支持向量机这两种集成代价敏感分类方法,并在10个UCI机器学习数据库的非平衡二分类数据集上进行算法实验分析,发现两个算法相对于其基准算法能够获得更好的预测性能。另外,还给出基于数据挖掘分类方法构建客户流失预测模型的评价指标,以用于案例分析。最后,论文以重庆市某商业银行个人理财业务客户数据集作为分析样本,运用论文提出的两种集成代价敏感分类方法在该客户数据集上分别建立客户流失预测模型,并将预测结果与常用数据挖掘分类算法:RBF神经网络、贝叶斯网络和Logistic回归等建立的预测模型的结果进行了对比分析,验证了两种算法的良好预测性能。鉴于模型可解释性,论文采用基于Boosting与代价敏感决策树的集成算法所建立的模型作为该案例的预测模型,讨论了该预测模型的决策规则抽取及解释等内容。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 研究背景和意义
  • 1.2 国内外研究现状
  • 1.3 论文主要研究内容
  • 2 论文相关基础理论
  • 2.1 客户流失相关理论概述
  • 2.1.1 客户流失的概念
  • 2.1.2 客户流失的分类
  • 2.1.3 客户流失的预测研究
  • 2.1.4 客户流失预测的两类错误
  • 2.2 分类方法概述
  • 2.2.1 决策树方法
  • 2.2.2 支持向量机方法
  • 2.2.3 人工神经网络方法
  • 2.2.4 贝叶斯分类方法
  • 2.2.5 Logistic 回归方法
  • 2.3 代价敏感学习概述
  • 2.4 集成学习概述
  • 2.4.1 集成学习的概念
  • 2.4.2 集成学习的主要算法
  • 2.5 本章小结
  • 3 基于集成代价敏感分类方法的客户流失预测模型
  • 3.1 研究的出发点及思路
  • 3.2 建模工具及数据准备
  • 3.2.1 WEKA 开源数据挖掘平台
  • 3.2.2 数据准备
  • 3.3 基于Boosting 与代价敏感决策树的客户流失预测建模方法
  • 3.3.1 决策树的构建及剪枝
  • 3.3.2 代价敏感决策树的构建及原理
  • 3.3.3 基于Boosting 和代价敏感决策树的集成算法及原理
  • 3.3.4 算法实验及评测
  • 3.4 基于Bagging 与代价敏感支持向量机的客户流失预测建模方法
  • 3.4.1 基本的支持向量机
  • 3.4.2 代价敏感支持向量机的建立及原理
  • 3.4.3 基于Bagging 和代价敏感支持向量机的集成算法及原理
  • 3.4.4 算法实验及评测
  • 3.5 客户流失预测模型评价指标
  • 3.6 本章小结
  • 4 商业银行个人理财业务客户流失预测模型案例分析
  • 4.1 研究的出发点及思路
  • 4.2 数据准备
  • 4.2.1 样本数据描述
  • 4.3.2 样本数据处理
  • 4.3 模型构建及参数选取
  • 4.3.1 基于Boosting 与代价敏感决策树的客户流失预测模型
  • 4.3.2 基于Bagging 与代价敏感支持向量机的客户流失预测模型
  • 4.4 模型评估及应用
  • 4.4.1 模型综合评估
  • 4.4.2 模型应用
  • 4.5 本章小结
  • 5 结论
  • 致谢
  • 参考文献
  • 附录
  • A 作者在攻读硕士学位期间发表的论文目录
  • B 作者在攻读硕士学位期间参加的科研项目
  • 附件
  • 相关论文文献

    • [1].基于客户细分的客户流失预测研究[J]. 通讯世界 2020(06)
    • [2].客户流失管理研究现状及展望[J]. 计算机系统应用 2017(12)
    • [3].浅谈客户流失[J]. 汽车维修技师 2017(05)
    • [4].客户流失研究综述[J]. 中国商论 2018(32)
    • [5].企业客户流失及对策研究[J]. 企业导报 2015(08)
    • [6].给不重视企业“生命”的药方(5)——客户流失防治方案:如何提供客户流失台账、报表与分析报告[J]. 汽车维修技师 2013(11)
    • [7].美国公司如何避免客户流失[J]. IT时代周刊 2010(11)
    • [8].基于层次分析法的商业零售业客户流失度分析[J]. 市场论坛 2008(05)
    • [9].基于深度置信神经网络的电信客户流失分析[J]. 通讯世界 2020(06)
    • [10].线上会员客户流失的建模与预测研究[J]. 管理现代化 2016(03)
    • [11].电子商务客户流失的建模与预测研究[J]. 计算机仿真 2012(05)
    • [12].你的客户流失了吗?[J]. 中国电信业 2012(06)
    • [13].数据挖掘在证券客户流失管理中的应用[J]. 科技管理研究 2011(10)
    • [14].邮政企业防止大客户流失对策探讨[J]. 邮政研究 2010(01)
    • [15].谈啤酒客户流失风险管理[J]. 啤酒科技 2009(04)
    • [16].基于深度学习的电信客户流失预测方法研究[J]. 电视技术 2020(04)
    • [17].基于自组织模糊规则归纳的电子商务客户流失预测[J]. 计算机应用与软件 2010(12)
    • [18].旅游业客户流失管理方法研究[J]. 商业研究 2008(08)
    • [19].农资企业:客户流失,该打谁的板子?[J]. 中国农资 2015(13)
    • [20].改进支持向量机在电信客户流失预测的应用[J]. 计算机仿真 2011(07)
    • [21].基于决策树技术的铁路货运企业客户流失问题研究[J]. 河南科技 2011(14)
    • [22].基于神经网络集成的电信客户流失预测建模及应用[J]. 大众商务 2010(06)
    • [23].如何保证老客户绝不流失?[J]. 北方牧业 2009(02)
    • [24].自我网络特征对电信客户流失的影响[J]. 管理科学 2017(05)
    • [25].基于决策树的证券客户流失模型[J]. 计算机应用与软件 2009(09)
    • [26].客户流失的五种解决方式[J]. 农化新世纪 2008(02)
    • [27].基于生存分析模型的电信客户流失研究[J]. 福州大学学报(哲学社会科学版) 2018(01)
    • [28].基于大数据分析的企业客户流失研究[J]. 现代国企研究 2015(12)
    • [29].大数据在客户流失预测中的应用研究[J]. 商业故事 2018(21)
    • [30].马年话营销——为什么客户满意度高,而实际客户流失数量也高?(7)[J]. 汽车维修技师 2014(09)

    标签:;  ;  ;  ;  

    基于集成代价敏感分类方法的客户流失预测研究
    下载Doc文档

    猜你喜欢