论文摘要
国内通信行业运营商在经过几次分拆和重组以及3G牌照的发放后,行业的竞争和对用户的争夺日益激烈,在如何提升服务意识、发展销售渠道和新的宣传方式等方面都面临着新的问题。在以客户为中心的竞争环境中,如果既能拥有大量的信息,又能拥有先进的分析信息的工具,就能在激烈的竞争中取得优势。数据挖掘是从大量数据中提取或挖掘知识进行数据分析,从而发现潜在信息的技术。对客户进行细分能够帮助企业从更加深入全面的角度洞察客户、了解客户价值取向,基于这种洞察在合适的时间通过合适的渠道向合适的客户提供量身定做的产品套餐。本文首先介绍了数据挖掘的相关理论和发展现状,其次对客户消费行为分析系统进行了设计目标和功能模块的需求分析,给出了系统的流程图,确定了选用聚类、决策树、关联规则三种算法进行数据挖掘,并详细介绍了聚类、决策树、关联规则三种算法的原理。本文结合通信行业运营商的实际情况,采用了K-means聚类算法、C5.0决策树和Apriori关联规则应用于客户消费行为分析,进行数据挖掘,设计并实现了客户消费行为分析系统。在数据挖掘模块的设计中,首先将常用的两种聚类算法进行比较,认为K-means算法能够很好的解决给出的数值型属性的数据对象的聚类问题,经常以局部最优结束,算法是相对可伸缩和高效率的,对输入数据顺序的敏感度一般,算法结果比较容易理解,建模速度也较快,与通信运用商现有数据库的特点相吻合,得出K-means算法更适用于进行客户消费行为分析的结论。本文将K-means算法用于对某通信运营商的客户进行细分为例,阐述了算法的实现过程,对结果进行了分析,并对算法进行了改进,减小了K-means算法因其初始聚类中心的随机选取而可能出现的算法在局部极小处收敛的可能性,提高了算法的聚类效果。其次,本系统还运用了Apriori关联规则进行数据挖掘,以长话漫游包产品是否适合捆绑销售为例,详细阐述了Apriori关联规则的实现过程,对结果进行了分析,并对算法进行了改进,由于Apriori关联规则存在多次扫描数据库,并通过模式匹配检查候选项集而导致效率低的问题,经过改进,Apriori关联规则只需扫描一次数据库,大大的提升算法了的效率。第三,本文将ID3、C4.5、C5.0、CART等主要决策树算法的关系和发展历程进行了介绍,C5.0决策树算法更适用于进行客户消费行为分析,本系统将C5.0决策树算法用于营销案目标客户的筛选,本文以长话包客户筛选为例,详细阐述C5.0决策树算法的实现过程,并对结果进行了分析总结。实际应用表明,数据挖掘技术对客户消费行为分析能取得很好的效果。帮助企业决策者洞察客户消费行为,从而达到提高企业利润的目的。最后,本文对基于数据挖掘集市的客户消费行为分析系统进行了总结。