数据挖掘中关联规则算法的研究

数据挖掘中关联规则算法的研究

论文摘要

“数据爆炸、知识贫乏”是信息时代所面临的一个严峻的问题,数据挖掘是解决该问题的一种十分有效的手段。数据挖掘就是数据库中的知识发现,是从海量数据信息中挖掘出潜在、有用知识的过程。该技术能发现隐含的、先前未知的、对决策有潜在价值的知识以指导实际问题的求解,因此对数据挖掘技术的研究有着重要的应用意义。本课题着重对关联规则挖掘算法进行了研究,详细探讨了关联规则挖掘中经典的Apriori算法,介绍了它的基本原理,存在的不足和算法发展的瓶颈。针对算法的缺陷介绍了已经存在的改进算法,如采样方法、划分方法和散列方法等。然后对Apriori算法的两个主要不足之处,即产生大量候选集和大规模数据库在挖掘过程中保持不变,介绍三种方法,以求能降低算法的时间复杂度。1、减小候选集算法。挖掘过程中产生大量候选集,在访问数据库统计候选集的支持数之前,运用新的算法减小候选集数目,从而减小访问数据库的次数。2、精简数据库算法。随着挖掘过程的不断深入,数据库中有些数据记录可能不再需要,因而我们可以删除无用的数据记录。不断减小数据库的规模,减小访问数据库的次数。3、数据的垂直表示方法。扫描数据库得到频繁一项集,同时将数据从水平格式变成垂直格式,此后的频繁集产生不再需要访问数据库。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的目的和意义
  • 1.2 国内外研究历史和现状
  • 1.3 课题的研究内容
  • 1.4 论文的组织
  • 1.5 本章小结
  • 第二章 数据挖掘概述
  • 2.1 数据挖掘概念
  • 2.2 数据来源和数据预处理
  • 2.2.1 数据挖掘的数据来源
  • 2.2.2 数据准备与预处理
  • 2.3 数据挖掘方法
  • 2.4 数据挖掘的体系结构与步骤
  • 2.4.1 数据挖掘的体系结构
  • 2.4.2 数据挖掘的步骤
  • 2.5 数据挖掘的知识发现及商业应用
  • 2.6 数据挖掘研究面临的挑战
  • 2.7 本章小结
  • 第三章 关联规则挖掘综述
  • 3.1 关联规则的基本概念
  • 3.1.1 关联规则的定义和属性
  • 3.1.2 关联规则的性质
  • 3.1.3 关联规则的种类
  • 3.2 关联规则的典型算法
  • 3.3 关联规则数据挖掘算法的步骤与性能分析
  • 3.3.1 算法步骤
  • 3.3.2 算法性能分析
  • 3.4 本章小结
  • 第四章 Apriori 算法原理及分析
  • 4.1 Apriori 算法描述
  • 4.2 Apriori 算法举例
  • 4.3 算法的优劣分析
  • 4.3.1 Apriori 算法的特点
  • 4.3.2 算法存在的不足
  • 4.4 几种优化的 Apriori 算法
  • 4.5 本章小结
  • 第五章 Apriori 算法的探讨研究
  • 5.1 Apriori 算法实例分析
  • 5.2 减小候选集数目算法
  • 5.2.1 算法思想与描述
  • 5.2.2 算法实例实现
  • 5.3 精简数据库算法
  • 5.3.1 算法思想与描述
  • 5.3.2 算法实例实现
  • 5.4 垂直数据表示方式
  • 5.4.1 算法思想与描述
  • 5.4.2 算法实例实现
  • 5.4.3 提出一种设想
  • 5.5 生成关联规则
  • 5.6 本章小结
  • 结论与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].多策略候选集构建与实体链接[J]. 计算机工程与科学 2018(12)
    • [2].多候选集广义正交匹配追踪算法[J]. 应用科学学报 2017(02)
    • [3].字符候选集筛选算法评测方法研究[J]. 信息技术 2018(01)
    • [4].基于有效候选集的支持向量机样本选择方法[J]. 计算机工程与应用 2008(23)
    • [5].基于双层候选集的快速人体-服装冲突检测[J]. 计算机辅助设计与图形学学报 2008(07)
    • [6].基于候选集的相似度度量的计算[J]. 中小企业管理与科技(下旬刊) 2016(04)
    • [7].基于BQPSO的多故障最小候选集生成技术研究[J]. 计算机测量与控制 2013(06)
    • [8].基于BPSO的多故障最小候选集生成技术[J]. 系统工程与电子技术 2012(05)
    • [9].Ad Hoc网络机会路由协议转发候选集算法的研究[J]. 计算机应用与软件 2012(12)
    • [10].基于可重构路由器装配的构件候选集生成方法研究[J]. 电子与信息学报 2010(08)
    • [11].FP-Growth算法在电子商务中的应用[J]. 科技与企业 2014(14)
    • [12].基于多尺度网格模型的物流配送中心选址候选集构建方法[J]. 控制与决策 2011(08)
    • [13].路网中查询点速度不确定的连续k近邻查询方法[J]. 小型微型计算机系统 2011(03)
    • [14].递减候选集正则化子空间追踪算法[J]. 控制与决策 2017(02)
    • [15].一种k-NN分类器k值自动选取方法[J]. 控制与决策 2013(07)
    • [16].基于层次候选集蚁群算法求解多级混流生产线动态排程问题[J]. 机械科学与技术 2008(04)
    • [17].频繁项集挖掘算法研究[J]. 计算机与现代化 2009(03)
    • [18].基于语义相关性的关联规则挖掘研究(英文)[J]. Journal of Southeast University(English Edition) 2008(03)
    • [19].基因表达数据分析中的特征基因提取[J]. 微计算机信息 2008(09)
    • [20].群体偏好增强的混合群推荐方法[J]. 计算机工程与应用 2017(09)
    • [21].一种改进的频繁项目集挖掘算法[J]. 阜阳师范学院学报(自然科学版) 2013(01)
    • [22].多跳无线网络中反馈式机会路由研究[J]. 小型微型计算机系统 2010(05)
    • [23].面向多属性的不等值连接操作算法[J]. 计算机工程 2019(06)
    • [24].基于项目候选集的协同过滤算法[J]. 计算机应用研究 2016(12)
    • [25].DBpedia Spotlight上的命名实体识别优化[J]. 计算机科学与探索 2017(07)
    • [26].数据网格环境下的多媒体资源检索[J]. 计算机工程 2011(08)
    • [27].采样过滤下的时空热点查询[J]. 太原理工大学学报 2020(04)
    • [28].基于候选项集剪枝的Apriori算法的研究[J]. 阜阳师范学院学报(自然科学版) 2014(04)
    • [29].一种改进的Conf-H-Mine算法[J]. 计算机工程 2008(02)
    • [30].基于存储改进的分区并行关联规则挖掘算法[J]. 计算机应用研究 2020(01)

    标签:;  ;  ;  ;  ;  

    数据挖掘中关联规则算法的研究
    下载Doc文档

    猜你喜欢