基于最大熵方法面向零售业的数据挖掘

基于最大熵方法面向零售业的数据挖掘

论文摘要

零售业从其诞生之日起,就一直伴随着激烈的竞争。尤其是随着中国加入WTO以来,零售业的日益开放已是不可阻挡的即成事实。世界上大型的零售企业如沃尔玛,麦德龙等也已经开展了其在国内的抢滩之路,国内零售企业必须采取有效的应对之策。国内零售企业在日常的业务活动中积累了大量的历史数据,但由于分析手段的缺乏,使得决定企业的决策不是基于数据库中丰富的数据和对市场的广泛调查,而是基于企业管理者的直觉,或想当然。因此提高企业的数据分析能力,同时建立一个基于相关数据的决策支持系统就变的十分重要。而数据挖掘技术作为近几年发展起来的数据组织和分析技术,在这一过程中无疑将发挥重要作用。文章根据帕累托的“20-80”规律,即企业收入的80%通常是来自于20%的顾客。提出了并非所有的客户对企业来说都是有价值的,优质客户给企业带来的利润远远超过一般客户。企业对客户购物行为进行分析,然后区别对待,有助于企业把有限精力集中在最有价值的客户上,提高企业竞争力。本文的目的和意义就是迅速准确地对客户信息进行分析和分类。现在使用的数据挖掘技术对优质客户的过滤还不够深入,准确率不高,无法分辨客户数据变化的意义,本文为此提出了利用最大熵方法来建立模型以过滤优质客户。最大熵模型作为一个比较成熟的统计模型,具有计算模型独立于特定的任务的特点,具有简洁、通用和易于移植等优点。但在最近几年的研究中只是被应用在关于自然语言处理的领域。如何将最大熵模型应用在零售业领域的数据挖掘中正是本文研究的重点问题。本文首先介绍了目前数据挖掘技术的研究背景,重点对OLAP和分类规则进行了介绍。在此基础上,介绍了最大熵模型的理论基础和算法。再通过零售业企业数据仓库的建立过程分析了零售业对数据挖掘的需求。本文的重点工作是将最大熵方法应用于零售业企业优质客户过滤中,提出了基于最大熵的优质客户过滤系统的基本框架;通过客户数据的不同特征相结合的方法,将客户数据表示成特征向量,并对使用不同特征集情况下的过滤性能进行了对比实验;提出了过滤模型的自适应调整和学习算法,以适应客户特征变化,满足用户的个性化过滤要求;将最大熵方法与其它常用的过滤方法(如贝叶斯方法)进行了性能比较,实验结果表明,这种方法在正确率等方面表现出了良好的过滤性能,可以较好的把关键用户的行为剥离出来,解决了依据历史数据对客户予以分类的工作。通过本文的工作,使得采用此系统和算法模型的企业利润有15.7%的提高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 论文的研究背景
  • 1.2 本文的内容和意义
  • 1.3 本文的篇章结构
  • 1.4 本章小结
  • 第二章 零售业数据挖掘现状及相关技术
  • 2.1 数据仓库
  • 2.2 在线事务处理(OLTP)
  • 2.3 数据预处理方法
  • 2.4 在线分析处理(OLAP)
  • 2.5 数据挖掘
  • 2.6 数据挖掘中的分类规则
  • 2.7 本章小结
  • 第三章 最大熵原理在零售业的建模
  • 3.1 最大信息熵原理
  • 3.2 最大熵模型
  • 3.3 最大熵模型算法
  • 3.4 最大熵模型的优点
  • 3.5 本章小结
  • 第四章 某商业集团数据仓库的需求和设计
  • 4.1 某商业集团数据收集现状分析
  • 4.2 某商业集团数据仓库的设计
  • 4.3 所采用的技术架构
  • 4.4 软硬件产品选择
  • 4.5 本章小结
  • 第五章 某商业集团数据挖掘系统的实现
  • 5.1 某商业集团利用数据挖掘的目的
  • 5.2 某商业集团数据挖掘系统分析
  • 5.3 利用最大熵的客户分析系统框架
  • 5.4 客户特征提取
  • 5.5 模型的自适应学习
  • 5.6 本章小结
  • 第六章 结论
  • 6.1 本文的总结
  • 6.2 本文的创新性
  • 6.3 本文的不足与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于最大熵人工智能方法的围棋落子预测[J]. 昆明理工大学学报(自然科学版) 2017(02)
    • [2].基于最大熵方法对测量数据估计的改进方法研究[J]. 价值工程 2010(28)
    • [3].基于最大熵方法的鲁棒自适应滤波及其应用[J]. 系统工程与电子技术 2020(03)
    • [4].最大熵方法的事件词识别[J]. 吕梁教育学院学报 2012(04)
    • [5].基于密度核估计的最大熵方法改进探析[J]. 现代商贸工业 2019(28)
    • [6].最大熵方法-功率谱密度分析法在时间序列资料研究中的应用[J]. 中国卫生统计 2010(05)
    • [7].最大熵方法在计算二维不变测度中的应用[J]. 浙江理工大学学报(自然科学版) 2017(04)
    • [8].结构动态可靠性分析的最大熵方法[J]. 机械制造与自动化 2020(02)
    • [9].基于核密度最大熵方法的杂系混合信号盲分离[J]. 计算机应用研究 2010(05)
    • [10].计算不变密度的一种二次样条最大熵方法(英文)[J]. 上海师范大学学报(自然科学版) 2015(03)
    • [11].基于最大熵方法进行动词搭配的自动标注[J]. 计算机工程与应用 2009(03)
    • [12].基于二维最大熵和教与学优化算法的图像分割[J]. 电视技术 2017(Z2)
    • [13].基于分段三次函数的最大熵方法的收敛性[J]. 哈尔滨师范大学自然科学学报 2016(02)
    • [14].单传感器数据处理最大熵方法[J]. 电子测量与仪器学报 2012(12)
    • [15].最大熵方法求解分数布朗运动驱动的Fokker-Planck方程[J]. 上海交通大学学报 2017(12)
    • [16].基于最大熵方法的水下航行体结构动力响应概率建模[J]. 力学学报 2018(01)
    • [17].测量不确定度信息约束下的最大熵分布研究[J]. 系统科学与数学 2017(12)
    • [18].基于最大熵的城郊公路接入口间距研究[J]. 重庆交通大学学报(自然科学版) 2018(03)
    • [19].基于最大熵方法的未来气候变化下狼毒在中国潜在分布的预测[J]. 植物保护学报 2019(01)
    • [20].图像分割的最大熵方法的改进[J]. 计算机工程与应用 2012(01)
    • [21].最大熵方法在组合期权定价中的应用[J]. 鲁东大学学报(自然科学版) 2012(04)
    • [22].最大熵原理在测量数据处理中的应用[J]. 电子测量与仪器学报 2009(01)
    • [23].基于最优插值和贝叶斯最大熵的海表温度融合方法研究[J]. 海洋技术学报 2018(02)
    • [24].年径流P-Ⅲ型分布的熵法估参[J]. 人民黄河 2010(04)
    • [25].基于Tsallis广义熵测算劳动力素质的提高对经济增长的贡献[J]. 中国软科学 2010(S1)
    • [26].边坡工程可靠性分析的最大熵方法[J]. 工程地质学报 2012(01)
    • [27].基于最大熵与交叉熵理论的刀具磨损检测技术[J]. 机床与液压 2018(22)
    • [28].基于最大熵的情感倾向研究[J]. 科技致富向导 2013(05)
    • [29].基于最大熵方法月球表面亮温度数据处理模拟[J]. 天文研究与技术 2013(03)
    • [30].基于广义最大熵的具有模糊输入输出的回归模型的参数估计[J]. 模糊系统与数学 2020(03)

    标签:;  ;  ;  ;  ;  ;  

    基于最大熵方法面向零售业的数据挖掘
    下载Doc文档

    猜你喜欢