商业数据流频繁模式挖掘算法研究与应用

商业数据流频繁模式挖掘算法研究与应用

论文摘要

随着知识经济时代的来临,信息与知识已经成为国家和企业发展的重要战略资源,是提高一个组织乃至一个国家战略竞争力的核心,也是实施科学管理与决策的基础。如何获取信息与发现知识,尤其是如何快速高效地在动态变化和爆炸性增长的海量数据流中获取信息和发现知识就成了关键性问题。与传统数据不同,数据流具有大量、快速连续到达、要求快速响应、一次扫描等特点。而商业数据流除了具备数据流的基本特点外,还具备连续性、冲突性、时间性、海量性和分布性等特性。因此传统的数据挖掘技术不能直接应用到商业数据流上。利用有限系统资源对商业数据流进行快速处理以获取有用信息,为数据挖掘在商业领域的应用研究带来了新的机遇和挑战。频繁模式挖掘是数据挖掘领域的一个基本问题,研究内容一般包括事务、序列、树和图。其方法被广泛应用于许多其它数据挖掘任务中,如相关性分析,序列周期分析,最大频繁模式,闭合频繁模式,查询,分类等等。由于问题本身的基础性和内在复杂性,频繁模式挖掘方法成为许多研究者关注的课题。本文对商业数据流频繁模式挖掘相关技术进行了研究。重点研究了以下几个问题:商业数据流的层次维度结构分析及其挖掘系统的研究;利用静态前窥树高效挖掘最大频繁模式和闭合频繁模式;利用增量式挖掘方式和倾斜时间窗口分别挖掘商业数据流中的最大模式和闭合模式;频繁模式算法在商业领域的实际应用问题等。本文研究内容和创新工作主要包括以下几个方面:首先,对数据流挖掘及其模型等相关理论进行研究,总结出目前该领域的最新研究成果,以期取其之长运用到商业数据流相关任务的挖掘上。接着,提炼出商业数据流的概念及特点,分析商业数据流的内容层次和类型维度结构,并以此构建出商业数据流管理系统BDSMS。然后,针对静态商业数据海量等特点,设计并实现最大频繁模式挖掘算法MFP和闭合频繁模式算法CFP。其中采取前馈剪枝、合并等策略修剪频繁模式树以提高频繁模式构成速度。在此基础上,针对时间序列模型和收银机模型,改进静态的频繁模式挖掘算法MFP和CFP,分别引入增量式挖掘和倾斜时间窗口得出商业数据流挖掘的单遍扫描算法SMFP和SCFP。最后,本文将上述算法应用到商业特定领域,设计实现了零售行业折扣券生成系统,并对其进行实验分析与研究,挖掘数据表明各算法都具有较高的准确性和时间效率,对商业决策支持具有一定的指导意义。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 1 绪论
  • 1.1 研究背景
  • 1.1.1 商业应用背景
  • 1.1.2 数据流挖掘
  • 1.1.3 数据流挖掘模型
  • 1.2 国内外研究现状
  • 1.3 本文的贡献
  • 1.4 本文的结构
  • 2 频繁模式挖掘相关理论回顾
  • 2.1 频繁模式与关联规则
  • 2.2 现有数据流频繁模式挖掘算法
  • 2.3 本章小结
  • 3 商业数据流挖掘模型研究
  • 3.1 数据流基本概念及特点
  • 3.2 商业数据流的结构分析
  • 3.2.1 概念及特点
  • 3.2.2 内容层次结构
  • 3.2.3 类型维度结构
  • 3.3 商业数据流管理系统的构建
  • 3.3.1 数据流管理系统分析
  • 3.3.2 商业数据流管理系统BDSMS
  • 3.4 本章小结
  • 4 数据流频繁模式挖掘算法
  • 4.1 最大频繁模式挖掘算法的研究
  • 4.1.1 问题的提出
  • 4.1.2 静态最大频繁模式挖掘算法MFP
  • 4.1.3 动态最大频繁模式挖掘算法SMFP
  • 4.2 闭合频繁模式挖掘算法的研究
  • 4.2.1 问题的提出
  • 4.2.2 静态闭合频繁模式挖掘算法CFP
  • 4.2.3 动态闭合频繁模式挖掘算法SCFP
  • 4.3 本章小结
  • 5 数据流挖掘算法在商业上的应用
  • 5.1 引言
  • 5.2 零售行业折扣券生成系统
  • 5.2.1 应用背景
  • 5.2.2 系统架构
  • 5.2.3 应用分析
  • 5.3 其他商业应用
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 附录1 攻读硕士期间发表的论文
  • 附录2 攻读硕士期间参加的课题和项目
  • 相关论文文献

    • [1].基于频繁模式挖掘对企业成功人士取得成就的因素研究[J]. 价值工程 2020(01)
    • [2].概率代表频繁模式挖掘[J]. 牡丹江师范学院学报(自然科学版) 2017(02)
    • [3].高效用频繁模式挖掘技术研究[J]. 齐鲁工业大学学报(自然科学版) 2017(01)
    • [4].不确定数据的频繁模式挖掘[J]. 白城师范学院学报 2016(05)
    • [5].一种快速频繁模式挖掘算法[J]. 烟台大学学报(自然科学与工程版) 2015(02)
    • [6].基于数据流的大图中频繁模式挖掘算法研究[J]. 计算机学报 2020(07)
    • [7].频繁模式挖掘系统的设计与开发[J]. 计算机技术与发展 2018(02)
    • [8].概率频繁模式挖掘算法研究综述[J]. 电子技术与软件工程 2017(08)
    • [9].基于滑动窗口模型的数据流加权频繁模式挖掘算法[J]. 软件工程 2016(10)
    • [10].基于分类频繁模式挖掘的书目推荐策略与算法[J]. 情报科学 2012(12)
    • [11].界标窗口数据流频繁模式挖掘特性[J]. 计算机工程与应用 2011(10)
    • [12].概念格在频繁模式挖掘中的应用研究[J]. 湖南科技大学学报(自然科学版) 2010(02)
    • [13].数据流的频繁模式挖掘算法浅析[J]. 电脑知识与技术 2008(S2)
    • [14].小波滤波在时间序列频繁模式挖掘中的应用[J]. 哈尔滨工程大学学报 2008(01)
    • [15].数据流频繁模式挖掘算法设计[J]. 计算机科学 2008(03)
    • [16].改进的频繁模式挖掘算法[J]. 计算机系统应用 2019(09)
    • [17].基于条件模式的一种无分组并行频繁模式挖掘算法(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2019(09)
    • [18].面向频繁模式挖掘的差分隐私保护研究综述[J]. 通信学报 2014(10)
    • [19].一种改进的压缩频繁模式挖掘算法[J]. 西南师范大学学报(自然科学版) 2013(07)
    • [20].频繁模式挖掘算法综述[J]. 福建电脑 2010(02)
    • [21].流数据频繁模式挖掘技术综述[J]. 内燃机与动力装置 2009(S1)
    • [22].时空轨迹频繁模式挖掘研究进展[J]. 江西科学 2017(06)
    • [23].基于复合粒度计算的频繁模式挖掘研究[J]. 计算机应用研究 2016(06)
    • [24].目标频繁模式挖掘算法研究[J]. 计算机工程与科学 2010(10)
    • [25].基于树搜索方式的频繁模式挖掘综述[J]. 计算机与信息技术 2009(05)
    • [26].面向数据流的频繁模式挖掘研究[J]. 计算机应用研究 2009(11)
    • [27].一种基于图形处理器的频繁模式挖掘算法[J]. 仪器仪表学报 2009(10)
    • [28].一种改进的频繁模式挖掘算法[J]. 电脑与电信 2013(03)
    • [29].频繁模式挖掘进展及典型应用[J]. 计算机工程与应用 2011(15)
    • [30].数据流频繁模式挖掘[J]. 渭南师范学院学报 2010(02)

    标签:;  ;  ;  ;  ;  ;  ;  

    商业数据流频繁模式挖掘算法研究与应用
    下载Doc文档

    猜你喜欢