论文摘要
随着信息技术尤其是网络技术的快速发展,人们收集、存储和传输数据的能力不断提高,导致数据出现了爆炸性增长。与此形成鲜明对比的是,对人们决策有价值的知识却非常匮乏。知识发现与数据挖掘正是在这一背景下诞生的一门新学科。关联规则是数据挖掘当前研究的主要模式之一,它用于确定数据集中不同域或属性之间的联系,找出有价值的多个域之间的依赖关系。频繁项集挖掘是生成关联规则的关键步骤,其效率问题是关联规则挖掘中的一大难点和热点。频繁项集挖掘可分为完全频繁项集挖掘、频繁闭项集挖掘和最大频繁项集挖掘三类。论文对关联规则的相关定义、频繁项集和最大频繁项集的挖掘方法进行了深入分析和研究。目标频繁项集挖掘是适应用户需要的一种频繁项集挖掘方法。TFP-树能有效过滤与目标模式无关的项和事物,将数据库中完整的、非冗余的信息压缩到一棵树上,使得搜索范围大大缩小;而基于SFP-树的频繁项集挖掘算法是一种较高效的算法,文章的第二部分和第三部分深入讨论了TFP-树和SFP-树结构,以及基于这两种树结构的频繁项集和最大频繁项集的挖掘算法,结合两者的优势,提出一种排序紧缩非冗余树FP-树,简称STFP-树,并提出基于STFP-树目标频繁项集算法STFP-growth和最大目标频繁项集挖掘算法STFP-Max,实验结果表明,算法是较高效的。随着Internet的发展和普及,网络安全问题日益突出,入侵检测是弥补防火墙的不足而提出的安全策略,文章的第四部分对关联规则挖掘算法在入侵检测中的应用进行探索性研究,将提出的目标频繁项集挖掘算法STFP-growth进行扩展,应用于入侵检测系统,通过KDD cup99实验数据对模型进行评估。
论文目录
摘要ABSTRACT目录第一章 绪论1.1 论文研究的背景1.1.1 数据挖掘的产生1.1.2 数据挖掘的定义1.1.3 数据挖掘的任务1.1.4 数据挖掘常用的方法1.1.5 数据挖掘的过程1.1.6 数据挖掘的应用1.1.7 数据挖掘面临的挑战1.2 本文的工作和组织形式1.2.1 本文的工作1.2.2 本文的组织形式1.3 本章小结第二章 关联规则概述2.1 关联规则的基本概念2.2 关联规则的分类2.3 关联规则挖掘的研究状况2.3.1 频繁项集挖掘的研究工作2.3.2 约束关联规则挖掘的研究工作2.4 本章小结第三章 基于 STFP-树的目标频繁项集挖掘算法3.1 约束关联规则的基本概念3.1.1 约束关联规则的定义和分类3.1.2 目标频繁项集与约束频繁项集3.2 目标频繁项集挖掘算法3.2.1 FP-树的结构3.2.2 紧缩的、非冗余的 TFP-树结构3.2.3 基于 TFP-树的目标频繁项集挖掘算法 TFP-Growth3.3 STFP-树的构造及算法3.4 改进的目标频繁项集挖掘算法 STFP-GROWTH3.4.1 基于 STFP-树的目标频繁项集挖掘算法 STFP-Growth3.4.2 实验结果与分析3.5 本章小结第四章 最大目标频繁项集挖掘算法研究4.1 引言4.2 基于 TFP-树的最大目标频繁项集挖掘算法4.3 基于 STFP-树的最大目标频繁项集挖掘算法4.4 性能比较与分析4.5 本章小结第五章 关联规则算法在网络入侵检测中的应用5.1 引言5.2 入侵检测的相关知识5.2.1 入侵检测的概念5.2.2 入侵检测系统分类5.2.3 入侵检测技术现状及发展方向5.3 基于数据挖掘的入侵检测系统模型和常用技术5.3.1 基于数据挖掘的入侵检测系统模型5.3.2 基于数据挖掘的入侵检测常用技术5.3.3 关联分析模型研究现状5.4 基于关联规则的入侵检测系统模型5.4.1 网络数据的收集与预处理5.4.2 KDD CUP 99数据集说明及分析5.4.3 关联分析5.5 实验与结果分析5.5.1 训练数据选取和初始化5.5.2 关联规则的产生5.5.3 关联规则用于入侵检测5.5.4 实验结果分析5.6 本章小结第六章 总结与展望6.1 论文研究工作结论6.2 论文进一步的研究参考文献致谢攻读学位期间发表论文情况
相关论文文献
标签:数据挖掘论文; 关联规则论文; 频繁项集论文; 目标频繁项集论文;