购物篮分析中若干问题的研究

购物篮分析中若干问题的研究

论文摘要

本文对购物篮分析中的两个问题进行了深入研究:最有利润的商品选择问题,价格促销利润估计问题。本文对这些问题提出了怎样将数据挖掘直接集成到用户目标中的方法。试验表明,这些方法是有效的。 本文提出MOPIS(MOst Profitable Items Selection)算法来选择出最有利润的商品。MOPIS通过预测多个选择的利润来选取最优的选择,通过预测某选择下新的交易数据库来预测该选择的利润。MOPIS算法准确建模了顾客的购买行为,能预测出买不到期望商品时,顾客选择购买其它商品的概率与数量;又能预测出不可得的商品对顾客的购买行为的影响。MOPIS算法使用了一种新的估计选择利润的有效方法,建立了新的商品选择框架,提出了一种新的通过商品间的距离来预测代替商品的购买数量、购买概率的方法,给出了一种新的计算品种间的交叉销售影响的有效方法,提出了用品种贡献值来排序品种间的交叉销售影响的新方法。本文给出了选取最有利润的商品的启发式算法,同时提出了用遗传算法来解决最有利润的商品选择问题的gaMOPIS算法。 本文提出PEPP算法来估计价格促销中的利润。PEPP根据促销前的交易来预测促销中的交易。PEPP算法准确建模了价格促销中顾客的购买行为,能预测出价格变化时,顾客选择购买其它商品的行为;又能预测出被促销的商品对顾客的购买行为的影响。提出了通过商品间的距离来预测价格促销中商品的购买数量及购买概率的新方法,给出了一种新的用交叉销售影响因子来预测被促销的商品对其它商品的影响的有效算法,提出了一种新的预测未购买被促销商品的顾客购买被促销商品的算法。 本文研究表明:MOPIS算法与gaMOPIS算法是解决最有利润的商品选择问题的有效算法;试验表明,MOPIS算法能快速发现具有高的选择利润率的选择,比MPIS平均要快14倍,对含有大量商品、大量交易的数据集也是有效的;PEPP算法是解决价格促销利润估计问题的有效算法;试验表明,PEPP算法能快速、高效地预测价格促销中的利润,且对具有大量交易、大量商品的数据集也是很有效的。

论文目录

  • 1 引言
  • 1.1 数据挖掘
  • 1.2 数据挖掘的应用
  • 1.3 数据挖掘面临的挑战
  • 1.4 本文研究内容
  • 2 数据挖掘
  • 2.1 数据挖掘概述
  • 2.2 概念/类描述:特征化与区分
  • 2.3 关联分析
  • 2.3.1 关联规则
  • 2.3.2 关联规则算法
  • 2.3.3 从关联规则挖掘到相关分析
  • 2.3.3.1 相关规则
  • 2.3.3.2 蕴涵规则
  • 2.3.3 强集合项目集
  • 2.3.4 因果关系
  • 2.4 分类与预测
  • 2.5 聚类分析
  • 2.6 异类分析
  • 2.7 进化分析
  • 2.8 感兴趣的数据挖掘
  • 3 购物篮分析
  • 3.1 购物篮数据
  • 3.2 商品间的相互依赖
  • 3.2.1 相互依赖的原因
  • 3.2.1.1 生产方的原因
  • 3.2.1.2 零售方的原因
  • 3.2.1.3 消费者的原因
  • 4 最有利润的商品选择
  • 4.1 已有的算法
  • 4.1.1 PROFSET
  • 4.1.2 HAP
  • 4.1.3 MPIS
  • 4.2 问题描述
  • 4.3 MOPIS算法
  • 4.3.1 MOPIS算法主要思想
  • 4.3.2 MOPIS算法
  • 4.3.3 商品的“增加利益”
  • 4.3.3.1 “增加利益”的计算
  • s(Iu)的计算'>4.3.3.2 ps(Iu)的计算
  • e(Iu,ti)的计算'>4.3.4 pe(Iu,ti)的计算
  • 4.3.5 商品的“删除利益”
  • 4.3.6 MOPIS算法几点说明
  • 4.3.7 MOPIS算法的创新点
  • 4.4 gaMOPIS
  • 4.4.1 gaMOPIS算法主要思想
  • 4.4.2 gaMOPIS算法
  • 4.5 性能评测
  • 4.6 MOPIS算法总结
  • 5 价格促销利润估计
  • 5.1 问题描述
  • 5.2 PEPP算法
  • 5.2.1 PEPP算法主要思想
  • 5.2.2 PEPP算法
  • 5.2.2.1 PEPP算法
  • 5.2.2.2 GetNearestItem
  • i)'>5.2.2.3 AddPromotedItems(ti
  • i,I′i)'>5.2.2.4 AddCrossedItems(ti,I′i
  • 5.2.2.5 交叉销售因子的计算
  • i的决定'>5.2.2.6 Pi的决定
  • 5.2.2.7 GetProfits()
  • 5.2.3 PEPP算法说明
  • 5.2.4 PEPP算法的扩展
  • 5.2.5 PEPP算法的优点
  • 5.3 性能评测
  • 5.4 PEPP算法总结
  • 6 总结、结论与展望
  • 6.1 总结
  • 6.2 结论
  • 6.3 本文的创新点
  • 6.4 以后的工作
  • 参考文献
  • 读博士期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  

    购物篮分析中若干问题的研究
    下载Doc文档

    猜你喜欢