论文摘要
目前,关联规则作为数据挖掘领域中一个非常重要的研究课题,己经取得了令人瞩目的成绩,但在实际应用中,随着数据库规模逐渐增大,出现了随着数据量递增而算法挖掘效率下降的问题,具有应用局限性。因此,必须研究和改进现有的算法,使其具有更高的效率和更广阔的应用前景。首先,本文对数据挖掘技术进行全面的分析,从数据挖掘的定义、任务、体系结构以及数据挖掘的模型进行研究,特别是对数据挖掘的方法进行了细分和比较。其次,本文研究了关联规则中经典的Apriori算法及其改进算法。为了解决这些算法在候选项目集和执行时间方面存在的问题,结合关联规则的性质和布尔向量的关系运算思想,提出了基于布尔矩阵的关联规则挖掘算法(Algorithm Base on Boolean Matrix)和幂集合算法(Power.Set)。布尔矩阵的关联规则算法在挖掘过程中仅扫描数据库一次,而且不产生候选项目集,从而减少了生成频繁项目集的时间开销,提高了算法效率;幂集合算法完全脱离Apriori算法的结构,它主要利用拆解交易记录的方式进行,其主要步骤是将每一条读入的交易记录根据特定原则快速拆解成各项目集,当数据库经过一次扫描后,表示所有的交易记录也同时被拆解完成,随后输入最小支持度和置信度,就可快速挖掘出符合使用者需要的频繁项目集,进而得到其关联规则。两种算法都达到了算法改进的目的。为了验证算法的性能,本文采用了实例法和实验法对提出的新算法和经典的Apriori算法进行了对比测试。试验结果表明,两种改进的算法在效率上明显优于Apriori算法,而且挖掘的数据量越大,数据库变化快,改进的算法效率越高,两种算法都具有较好的可扩展性和较广阔的应用前景。最后,将基于布尔矩阵的关联规则算法应用在商场营销中,发现物品之间的关联性,为决策者提供指导和数据支持,从而提高企业利润。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景与意义1.2 关联规则应用现状及发展方向1.2.1 关联规则的研究现状1.2.2 关联规则的发展方向1.3 论文主要研究内容1.4 本文结构第二章 数据挖掘理论2.1 数据仓库和联机分析处理(OLAP)2.1.1 数据仓库2.1.2 联机分析处理(OLAP)2.2 数据挖掘技术2.2.1 数据挖掘的定义2.2.2 数据挖掘的任务2.2.3 数据挖掘的方法2.2.4 数据挖掘的体系结构2.2.5 数据挖掘过程的标准化及模型第三章 关联规则挖掘理论和经典算法3.1 关联规则的基本概念3.1.1 关联规则的性质3.1.2 关联规则的挖掘过程3.1.3 关联规则的分类3.1.4 关联规则的挖掘步骤及应注意的问题3.2 关联规则的挖掘算法——APRIORI 算法3.2.1 关联规则算法的相关定义及性质3.2.2 找出频繁项集的Apriori 算法描述3.2.3 实例分析3.2.4 Apriori 算法的性能分析3.3 现有APRIORI 算法的改进思想和算法3.3.1 几种改进的算法思想3.3.2 几种改进的算法3.4 关联规则挖掘的扩充3.4.1 基于约束的关联规则3.4.2 时态约束关联规则3.4.3 变支持度关联规则3.4.4 多层关联规则挖掘3.4.5 多维关联规则挖掘第四章 关联规则挖掘算法的改进4.1 基于布尔矩阵的关联规则挖掘算法4.1.1 算法相关定义和性质4.1.2 算法实现步骤及描述4.1.3 实例分析4.1.4 两种算法性能分析及比较4.2 幂集合(PS)算法4.2.1 算法相关定义和性质4.2.2 PS 算法描述4.2.3 PS 算法中交易记录拆解过程4.2.4 PS 算法完整实例说明4.2.5 PS 算法的特殊性能分析4.2.6 PS 算法与Apriori 算法比较4.2.7 PS 算法的限制4.3 算法分析与总结第五章 关联规则算法在商场营销中的应用5.1 数据准备5.2 关联规则挖掘5.3 挖掘结果分析第六章 总结与展望参考文献致谢附录个人简历
相关论文文献
标签:数据挖掘论文; 关联规则论文; 频繁项目集论文; 布尔矩阵论文; 幂集合论文;