论文摘要
“数据爆炸、知识贫乏”是信息时代所面临的一个严峻的问题,数据挖掘是解决该问题的一种十分有效的手段。数据挖掘就是数据库中的知识发现,是从海量数据信息中挖掘出潜在、有用知识的过程。该技术能发现隐含的、先前未知的、对决策有潜在价值的知识以指导实际问题的求解,因此对数据挖掘技术的研究有着重要的应用意义。本课题着重对关联规则挖掘算法进行了研究,详细探讨了关联规则挖掘中经典的Apriori算法,介绍了它的基本原理,存在的不足和算法发展的瓶颈。针对算法的缺陷介绍了已经存在的改进算法,如采样方法、划分方法和散列方法等。然后对Apriori算法的两个主要不足之处,即产生大量候选集和大规模数据库在挖掘过程中保持不变,介绍三种方法,以求能降低算法的时间复杂度。1、减小候选集算法。挖掘过程中产生大量候选集,在访问数据库统计候选集的支持数之前,运用新的算法减小候选集数目,从而减小访问数据库的次数。2、精简数据库算法。随着挖掘过程的不断深入,数据库中有些数据记录可能不再需要,因而我们可以删除无用的数据记录。不断减小数据库的规模,减小访问数据库的次数。3、数据的垂直表示方法。扫描数据库得到频繁一项集,同时将数据从水平格式变成垂直格式,此后的频繁集产生不再需要访问数据库。
论文目录
相关论文文献
- [1].多策略候选集构建与实体链接[J]. 计算机工程与科学 2018(12)
- [2].多候选集广义正交匹配追踪算法[J]. 应用科学学报 2017(02)
- [3].字符候选集筛选算法评测方法研究[J]. 信息技术 2018(01)
- [4].基于有效候选集的支持向量机样本选择方法[J]. 计算机工程与应用 2008(23)
- [5].基于双层候选集的快速人体-服装冲突检测[J]. 计算机辅助设计与图形学学报 2008(07)
- [6].基于候选集的相似度度量的计算[J]. 中小企业管理与科技(下旬刊) 2016(04)
- [7].基于BQPSO的多故障最小候选集生成技术研究[J]. 计算机测量与控制 2013(06)
- [8].基于BPSO的多故障最小候选集生成技术[J]. 系统工程与电子技术 2012(05)
- [9].Ad Hoc网络机会路由协议转发候选集算法的研究[J]. 计算机应用与软件 2012(12)
- [10].基于可重构路由器装配的构件候选集生成方法研究[J]. 电子与信息学报 2010(08)
- [11].FP-Growth算法在电子商务中的应用[J]. 科技与企业 2014(14)
- [12].基于多尺度网格模型的物流配送中心选址候选集构建方法[J]. 控制与决策 2011(08)
- [13].路网中查询点速度不确定的连续k近邻查询方法[J]. 小型微型计算机系统 2011(03)
- [14].递减候选集正则化子空间追踪算法[J]. 控制与决策 2017(02)
- [15].一种k-NN分类器k值自动选取方法[J]. 控制与决策 2013(07)
- [16].基于层次候选集蚁群算法求解多级混流生产线动态排程问题[J]. 机械科学与技术 2008(04)
- [17].频繁项集挖掘算法研究[J]. 计算机与现代化 2009(03)
- [18].基于语义相关性的关联规则挖掘研究(英文)[J]. Journal of Southeast University(English Edition) 2008(03)
- [19].基因表达数据分析中的特征基因提取[J]. 微计算机信息 2008(09)
- [20].群体偏好增强的混合群推荐方法[J]. 计算机工程与应用 2017(09)
- [21].一种改进的频繁项目集挖掘算法[J]. 阜阳师范学院学报(自然科学版) 2013(01)
- [22].多跳无线网络中反馈式机会路由研究[J]. 小型微型计算机系统 2010(05)
- [23].面向多属性的不等值连接操作算法[J]. 计算机工程 2019(06)
- [24].基于项目候选集的协同过滤算法[J]. 计算机应用研究 2016(12)
- [25].DBpedia Spotlight上的命名实体识别优化[J]. 计算机科学与探索 2017(07)
- [26].数据网格环境下的多媒体资源检索[J]. 计算机工程 2011(08)
- [27].采样过滤下的时空热点查询[J]. 太原理工大学学报 2020(04)
- [28].基于候选项集剪枝的Apriori算法的研究[J]. 阜阳师范学院学报(自然科学版) 2014(04)
- [29].一种改进的Conf-H-Mine算法[J]. 计算机工程 2008(02)
- [30].基于存储改进的分区并行关联规则挖掘算法[J]. 计算机应用研究 2020(01)