论文摘要
关联规则挖掘是数据挖掘领域中的一个非常重要的研究课题。它最初提出的目的是用于发现大量数据中不同项集之间的有趣联系。本文在现有数据挖掘研究成果的基础上,对数据挖掘技术及关联规则挖掘理论和算法进行了研究,基于Apriori算法提出了一种改进算法,并对算法的性能进行了分析比较,同时针对相关性规则挖掘算法展开了讨论。首先,介绍了数据挖掘的定义、方法、功能、分类以及研究方向,同时给出了关联规则挖掘的基本概念,介绍了关联规则挖掘的理论基础和算法分类,讨论了一系列改进算法的特点以及基于支持度-置信度框架的关联规则挖掘算法存在的问题。其次,着重对经典的关联规则算法-Apriori算法进行了分析和讨论,指出它的理论价值以及性能瓶颈问题,针对关联规则挖掘算法的复杂度问题和算法产生的结果问题进行了深入分析和研究,提出一种改进的算法并对改进算法思想进行论证,通过实例进行了验证,同时对算法的性能进行分析。最后,针对基于支持度-置信度框架的关联规则挖掘算法存在的问题,进行了关联规则相关性分析,讨论各种已有的相关性规则挖掘算法,并针对已有算法的局限性提出了优化策略。关联规则挖掘广泛应用于各个领域,有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此关联规则挖掘具有广阔的应用前景。