论文摘要
随着中国加入WTO,随着市场经济的建立和发展,经济体制日趋完善,零售企业之间的竞争也日趋激烈,各零售企业之间对客户的争夺越来越激烈,面对消费客户的日趋饱和,在没有更多的消费者的情况下,企业对VIP客户的重要性的认识日益提高。在激烈市场竞争中,短期内消费者的总体数量基本上不会有太大的浮动,消费者的总体消费额不会有很大的起伏,如果谁能发掘出更多的高消费的VIP客户并保持好良好的沟通,把握住这些VIP客户的需求,尽最大的努力去满足这些VIP客户,并与VIP客户建立牢固的关系,在客户基本上保持不变的情况下,提高这些VIP顾客的消费额,挖掘出更多的VIP客户,谁就可以在客户总体数量变化不大的情况下获得更多的营业额,而且可以在激烈的竞争中立于不败之地。根据调查,企业维持和发展一位普通客户所得到的利润最多只是维持和发展一位VIP客户的二十分之一到三十分之一。本论文根据零售业中客户的消费数据去挖掘出更多的VIP客户,并维持和这些VIP客户的牢固关系,尽量的提高他们的消费额,本文主要陈述了数据挖掘方面的基础知识,概括了数据挖掘技术中的分类算法中的决策树算法,着重分析了决策树中的SPRINT分类算法,进行了相应的改进,提高了算法的执行速度,同时采用了改进后的SPRINT分类算法对数据进行分类,建立了潜在VIP客户的分类模型,提供了零售业从海量消费客户的数据中发掘潜在VIP客户的分类问题的参考。本文针对国内零售企业的目前情况,提出了利用零售业现有的资料进行零售业中潜在VIP客户的分类预测的研究。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景及意义1.2 研究动机与目的1.3 论文内容安排第二章 数据挖掘技术概述2.1 数据挖掘背景2.2 数据挖掘研究的现状2.3 数据挖掘概念2.4 数据挖掘的三个特征2.5 数据挖掘常用技术2.5.1 探索型数据挖掘2.5.2 预测型数据挖掘2.6 数据挖掘技术的分类2.7 数据挖掘的流程2.7.1 确定业务对象2.7.2 数据准备2.7.3 数据挖掘2.7.4 结果分析2.7.5 知识的同化2.8 数据挖掘研究存在的主要问题2.9 本章小结第三章 分类算法3.1 分类的概述3.2 数据分类的过程3.3 几种典型的分类算法3.3.1 贝叶斯分类算法3.3.2 支持向量机(SVM)3.3.3 神经网络3.3.4 基于数据库技术的分类算法3.3.5 决策树分类算法3.4 SPRINT 算法3.4.1 SPRINT 算法简介3.4.2 SPRINT 的基本思想3.4.3 最佳分割点3.4.4 寻找数值属性的最佳分割点3.4.5 寻找离散属性的最佳分割点3.4.6 结点的划分3.4.7 剪枝3.4.8 程序流程图3.5 SPRINT 算法的改进3.5.1 SPRINT 算法的不足3.5.2 对于以上两点不足之处的改进3.5.3 SPRINT 算法的改进的具体过程3.6 SPRINT 算法改进前后的性能测试3.7 本章小结第四章 改进后的SPRINT 算法在零售业中潜在VIP 客户中的研究应用4.1 建立潜在VIP 客户的研究模型4.1.1 对数据进行规范化4.1.2 建立分类所需的训练集和测试集4.1.3 建立相应的潜在VIP 客户的分类规则4.1.4 采用改进后的SPRINT 算法对训练集数据进行分类4.1.5 对分类后的叶子结点分类别进行统计4.1.6 对挖掘出来的数据进行相应处理4.2 系统所需数据结构4.2.1 SPRINT 算法所需数据结构4.2.2 SPRINT 算法数据结构的C++语言实现4.2.3 改进后的SPRINT 算法中加入的数据结构4.3 数据准备4.3.1 数据抽取4.3.2 数据清洗4.3.3 数据整合4.3.4 数据筛选4.3.5 数据转换4.3.6 数据归约4.4 数据挖掘4.5 改进前后的SPRINT 算法的系统挖掘结果的比较分析第五章 结论和展望5.1 小结5.2 展望参考文献攻读硕士学位期间发表的学术论文致谢
相关论文文献
标签:数据挖掘论文; 分类论文; 决策树论文; 算法论文;