论文摘要
随着社会信息化程度的提高,数据量呈指数增长。从大量数据中快速有效地获得最有价值的信息资源在当今信息时代具有重要意义。因此,与数据挖掘相关的技术和工具面临很好的发展前景。其中,分类预测技术作为智能决策的重要手段将在未来的智能系统中发挥重要作用。本文对关联分类技术做了全面系统的研究,对典型算法做了详细的理论阐述。同时针对现有关联分类算法存在受支持度阈值和置信度阈值设置影响的问题进行了改进,提出了基于支持度与置信度阈值优化技术的关联分类算法(Apriori_TFP CMAR(HC)),并在该算法基础上设计和实现了一个规则提取系统。首先,本文对关联分类技术目前的研究现状以及与之相关的部分领域,如关联规则挖掘技术进行了概述。然后,研究了Apriori_TFP关联规则挖掘算法以及CMAR关联分类算法,并且通过结合两者的关键技术(改进的数据存储结构),实现了一种新的关联分类算法Apriori_TFP CMAR,经过实验验证,该算法取得了较好的分类效果,减少了运算时间和存储空间的占用。此后,本文重点通过设计利用了爬山法搜索技术来获得使分类准确率最高的支持度与置信度阈值,从而解决了目前关联分类算法普遍存在的问题:分类的准确性受到人为设定的支持度与置信度阈值的影响,难以保证分类器总能达到较好的分类效果。最后,本文设计并实现了一个基于Apriori_TFP CMAR(HC)算法的规则提取系统,该系统同时集成了数据预处理功能,并且得到了较好的实验测试结果。
论文目录
中文摘要ABSTRACT第一章 绪论1.1 本课题选题的理由或意义1.2 国内外研究现状及趋势1.3 研究目标、研究内容和解决的关键问题1.3.1 研究目标1.3.2 研究内容1.3.3 解决的关键问题1.4 本文的创新之处和研究成果1.4.1 创新之处1.4.2 取得的研究成果1.5 本文的组织第二章 关联分类算法发展概述2.1 关联分类算法的源泉:关联规则挖掘算法2.1.1 关联规则的相关定义和性质2.1.2 关联规则挖掘算法分类2.1.3 关联规则挖掘的经典算法——Apriori算法2.2 分类关联规则的定义与作用2.2.1 分类关联规则的提出2.2.2 分类关联规则相关定义2.3 关联分类算法的发展TFPCMAR关联分类算法'>第三章 AprioriTFPCMAR关联分类算法TFP关联规则挖掘算法关键技术'>3.1 AprioriTFP关联规则挖掘算法关键技术3.1.1 P树的作用及建构3.1.2 T树的作用及建构3.2 CMAR关联分类算法关键技术3.2.1 规则存储3.2.2 规则剪枝TFP算法实现CMAR关联分类算法'>3.3 基于AprioriTFP算法实现CMAR关联分类算法TFPCMAR算法思想'>3.3.1 AprioriTFPCMAR算法思想3.3.2 实验及其结果分析第四章 基于支持度与置信度阈值优化技术的关联分类算法4.1 支持度和置信度阈值设置对分类准确率的影响分析4.2 优化技术设计4.3 实验及其结果分析第五章 关联分类规则提取系统的实现5.1 系统功能框架设计5.1.1 数据输入模块5.1.2 数据预处理模块5.1.3 规则提取模块5.1.4 显示模块5.2 系统逻辑单元设计5.3 系统交互设计5.4 实验结果第六章 研究总结与展望6.1 本文研究总结6.2 下一步工作计划附录参考文献致谢
相关论文文献
标签:关联规则论文; 关联分类论文; 支持度阈值论文; 置信度阈值论文; 爬山法论文; 规则提取系统论文;