论文摘要
频繁模式挖掘是数据挖掘中的一项重要任务,通过挖掘频繁模式,我们可以发现隐藏在数据中的有趣的相关和关联。频繁项集的挖掘作为频繁模式挖掘中的一类,它可以广泛应用在关联规则挖掘、聚类、分类和预测、入侵检测、相关性分析等等许多种数据挖掘任务中。由于数据挖掘在开始被提出时就是面向海量数据的,庞大的搜索空间使得许多传统的数据挖掘算法的效率并不理想。高性能并行环境为数据挖掘的发展开辟了一条新的路径,研究并行环境下的数据挖掘并行算法成为了数据挖掘界的热点。频繁项集挖掘也不例外,经过这些年的研究,并行化的频繁项集挖掘算法已经取得了一些成果。本文提出了一种基于分布式并行环境的频繁项集挖掘算法HPFP-Miner. HPFP-Miner算法是一种类FP-Growth算法,通过将数据库压缩到一个数据结构上进行挖掘。算法利用两次数据库扫描,在各并行结点上建立HPFP-tree和HPFP-forest.各节点只需要挖掘本地HPFP-tree,最后将挖掘结果统一到一个共享文件中。通讯集中在建树阶段,整个挖掘过程不需要节点间的同步,大大减少了通讯量,提高了算法的效率。由于数据流在日常生活中的广泛应用,数据流频繁项集挖掘受到了人们的关注。数据流有着快速变化的、海量的和无限的等特点,必须建立新的数据结构和算法对其进行挖掘。本文在上述算法的基础上,提出了基于滑动窗口的并行化的数据流频繁项集挖掘算法PFIMSD算法。算法仅通过一次扫描将当前窗口的所有数据压缩到并行节点上的PSD-tree上,窗口滑动时用增量的方法在PSD-tree上添加和删除相应分支。实验证明PFIMSD算法有着很好的时间效率和扩展性。
论文目录
相关论文文献
- [1].基于频繁项集挖掘的零售医药企业药品关联研究[J]. 重庆科技学院学报(自然科学版) 2019(06)
- [2].基于差异节点集的加权频繁项集挖掘算法[J]. 计算机工程 2020(05)
- [3].基于强化学习的大数据频繁项集挖掘算法[J]. 信息通信 2020(06)
- [4].浅谈加权频繁项集挖掘的研究进展[J]. 电脑知识与技术 2019(27)
- [5].频繁项集挖掘的研究进展及主流方法[J]. 计算机科学 2018(S2)
- [6].不确定数据中的代表频繁项集近似挖掘[J]. 计算机与数字工程 2017(02)
- [7].基于频繁项集挖掘算法的伴随车应用与实现[J]. 计算机应用与软件 2017(04)
- [8].基于渐近取样的频繁项集挖掘近似算法[J]. 控制工程 2017(09)
- [9].一种利用差集的加权频繁项集挖掘算法[J]. 辽宁工程技术大学学报(自然科学版) 2016(03)
- [10].基于差分隐私的频繁项集挖掘研究综述[J]. 电子技术与软件工程 2016(03)
- [11].挖掘完全频繁项集的蚁群算法[J]. 微电子学与计算机 2014(12)
- [12].大数据环境下频繁项集挖掘的研究[J]. 青岛科技大学学报(自然科学版) 2015(02)
- [13].基于K均值聚类的大数据频繁项集挖掘研究[J]. 计算机仿真 2020(08)
- [14].基于动态数据的加权频繁项集挖掘算法[J]. 科学技术与工程 2019(20)
- [15].基于强化学习的大数据频繁项集挖掘算法[J]. 计算机工程与设计 2019(08)
- [16].大数据环境下基于前缀树的频繁项集挖掘[J]. 控制工程 2019(11)
- [17].一种高效的改进频繁项集挖掘算法[J]. 微电子学与计算机 2018(02)
- [18].关联规则频繁项集挖掘算法设计与实现[J]. 特区经济 2018(08)
- [19].基于概率模型的概率频繁项集挖掘方法[J]. 安阳师范学院学报 2017(02)
- [20].基于二叉树的并行频繁项集挖掘算法[J]. 计算机技术与发展 2015(10)
- [21].分布式频繁项集挖掘算法[J]. 计算机应用与软件 2015(10)
- [22].基于闭频繁项集挖掘的技术演化研究方法[J]. 图书情报工作 2013(19)
- [23].不确定数据频繁项集挖掘方法探析[J]. 莆田学院学报 2014(02)
- [24].一种基于多核微机的闭频繁项集挖掘算法[J]. 计算机应用与软件 2013(03)
- [25].基于改进倒排表和集合的最频繁项集挖掘算法[J]. 计算机应用研究 2012(06)
- [26].一种分布式全局频繁项集挖掘方法[J]. 计算机工程与应用 2011(29)
- [27].一种有效的负频繁项集挖掘方法[J]. 山东轻工业学院学报(自然科学版) 2011(04)
- [28].一种改进的加权频繁项集挖掘算法[J]. 计算机工程与应用 2010(23)
- [29].入侵检测中加权频繁项集挖掘[J]. 计算机工程与设计 2008(08)
- [30].一种新的动态频繁项集挖掘方法[J]. 计算机工程与应用 2008(21)