论文摘要
随着现代科学技术的发展,计算机科学与技术的进步,数据挖掘作为一门崭新的知识发现技术学科得到了快速的发展。数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的大型数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识。由于我们在科学研究以及日常事务中积累了大量的数据资料,如果不借助有用的工具去发现其中潜在有用的信息,即使是知识的海洋,我们也将信息贫乏,很多有用的信息也不能够被我们发现。由于以往的算法如:经典算法Aprior算法需要多次扫描数据库,产生大量候选项集,而FP-Growth算法需要建立庞大FP-Tree占用大量内存,它们在效率上不高,当面临十分庞大的数据库时,其算法在效率上显然不足,也不能够适应大型数据库的数据挖掘,效率问题成为该研究与应用的关键和难点。FP-Growth算法采用分而治之的策略,把数据库中的频繁项集压缩到一棵频繁模式树(FP-tree)中,同时保留项集之间的关联信息,再将FP-tree划分为一些条件模式库分别进行挖掘。由于不用多次扫描数据库,不产生候选项集,其效率显然比Apriori算法高,但是该算法由于要建立FP-tree需要占用大量内存,所以不适用于大型数据库进行数据挖掘。Parallel Algorithm算法是指在并行机上,将一个任务分解成多个子任务(task),分配给多个不同的处理器(process),各个处理器之间相互协同合作,并行地执行子任务,从而达到加速求解速度或者求解应用问题规模的目的。本论文研究的是基于FP-Growth关联规则的并行算法问题,通过对当前FP-Growth和Parallel Algorithm的一些关键技术的研究,提出一种基于FP-Growth关联规则的并行算法分析及其应用研究。该算法针对以往算法的缺点和不足,在FP-Growth算法基础上,借助并行算法的思想,将数据库分块以及保留数据相关性不变的FP-tree树划分算法,同时将任务合理分配,并将它们进行合理组合,在负载平衡,多处理器调度上做了相应的研究,使任务达到合理分配组合、实现了较好的负载平衡,提高了算法速度,此算法适用于大型数据库的数据挖掘,相对以往算法,在效率上有了显著的提高。
论文目录
相关论文文献
- [1].基于FP-Growth的图上随机游走推荐方法[J]. 计算机科学 2017(06)
- [2].一种基于FP-Growth的频繁项目集并行挖掘算法[J]. 计算机工程与应用 2014(02)
- [3].FP-Growth关联规则算法在高校排课系统设计中的应用研究[J]. 电子技术与软件工程 2014(06)
- [4].基于FP-growth算法的高校群体性突发事件关联规则分析[J]. 中国安全科学学报 2012(12)
- [5].基于FP-Growth算法的配电网薄弱点分析研究[J]. 电测与仪表 2020(17)
- [6].基于FP-Growth算法的安全日志分析系统[J]. 电子科技 2016(09)
- [7].船舶管理中基于负载平衡的并行FP-growth算法研究[J]. 舰船科学技术 2019(21)
- [8].一个基于兴趣度的FP-Growth算法改进[J]. 宜宾学院学报 2008(12)
- [9].FP-Growth算法在电子病历挖掘中的应用[J]. 大众科技 2010(12)
- [10].改进的FP-growth关联规则算法及其在图书推荐系统中的应用[J]. 微型电脑应用 2014(12)
- [11].基于FP-growth算法的高校招生就业决策分析系统研究与设计[J]. 科技广场 2011(11)
- [12].基于FP-Growth算法的四物汤类方配伍规律及应用研究[J]. 世界科学技术(中医药现代化) 2010(06)
- [13].面向计算机集群系统的FP-Growth算法的并行计算[J]. 中国管理信息化 2009(15)
- [14].集群系统中的FP-Growth并行算法[J]. 计算机工程 2009(20)
- [15].基于增量式FP-Growth算法的关联规则挖掘模型设计[J]. 信息技术与信息化 2020(03)
- [16].改进的Fp-Growth数据关联挖掘算法研究[J]. 河北能源职业技术学院学报 2013(01)
- [17].基于FP-growth算法的学生选课关联规则分析[J]. 电脑知识与技术 2009(23)
- [18].一种基于FP-growth算法的变电站二次设备缺陷分析方法[J]. 电测与仪表 2020(12)
- [19].负载均衡的FP-growth并行算法研究[J]. 计算机工程与应用 2010(04)
- [20].基于FP-Growth的关联规则算法在心血管系统药物相互作用上的分析研究[J]. 西安文理学院学报(自然科学版) 2020(02)
- [21].基于FP-growth关联规则算法的推荐系统设计与实现[J]. 轻工科技 2016(10)
- [22].基于FP-Growth算法的民航鸟击事件关联性分析[J]. 安全与环境学报 2016(01)
- [23].基于FP-growth算法的数据挖掘实例研究[J]. 物流工程与管理 2015(05)
- [24].基于FP-Growth算法的中药配方数据挖掘[J]. 医学信息 2009(12)
- [25].基于FP-growth算法的用电异常数据挖掘方法[J]. 电子技术应用 2020(10)
- [26].基于改进的FP-Growth算法提取客户关系图[J]. 电脑知识与技术 2015(03)
- [27].基于MapReduce的垂直FP-growth挖掘算法研究[J]. 计算机与数字工程 2018(07)
- [28].关联规则算法FP-growth的研究与分析[J]. 计算机与网络 2016(24)
- [29].基于FP-Growth的网络流量识别技术研究[J]. 北京印刷学院学报 2020(S1)
- [30].海量数据下基于Hadoop的分布式FP-Growth算法[J]. 轻工学报 2018(05)