关联分类算法研究及其系统实现

关联分类算法研究及其系统实现

论文摘要

随着社会信息化程度的提高,数据量呈指数增长。从大量数据中快速有效地获得最有价值的信息资源在当今信息时代具有重要意义。因此,与数据挖掘相关的技术和工具面临很好的发展前景。其中,分类预测技术作为智能决策的重要手段将在未来的智能系统中发挥重要作用。本文对关联分类技术做了全面系统的研究,对典型算法做了详细的理论阐述。同时针对现有关联分类算法存在受支持度阈值和置信度阈值设置影响的问题进行了改进,提出了基于支持度与置信度阈值优化技术的关联分类算法(Apriori_TFP CMAR(HC)),并在该算法基础上设计和实现了一个规则提取系统。首先,本文对关联分类技术目前的研究现状以及与之相关的部分领域,如关联规则挖掘技术进行了概述。然后,研究了Apriori_TFP关联规则挖掘算法以及CMAR关联分类算法,并且通过结合两者的关键技术(改进的数据存储结构),实现了一种新的关联分类算法Apriori_TFP CMAR,经过实验验证,该算法取得了较好的分类效果,减少了运算时间和存储空间的占用。此后,本文重点通过设计利用了爬山法搜索技术来获得使分类准确率最高的支持度与置信度阈值,从而解决了目前关联分类算法普遍存在的问题:分类的准确性受到人为设定的支持度与置信度阈值的影响,难以保证分类器总能达到较好的分类效果。最后,本文设计并实现了一个基于Apriori_TFP CMAR(HC)算法的规则提取系统,该系统同时集成了数据预处理功能,并且得到了较好的实验测试结果。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 本课题选题的理由或意义
  • 1.2 国内外研究现状及趋势
  • 1.3 研究目标、研究内容和解决的关键问题
  • 1.3.1 研究目标
  • 1.3.2 研究内容
  • 1.3.3 解决的关键问题
  • 1.4 本文的创新之处和研究成果
  • 1.4.1 创新之处
  • 1.4.2 取得的研究成果
  • 1.5 本文的组织
  • 第二章 关联分类算法发展概述
  • 2.1 关联分类算法的源泉:关联规则挖掘算法
  • 2.1.1 关联规则的相关定义和性质
  • 2.1.2 关联规则挖掘算法分类
  • 2.1.3 关联规则挖掘的经典算法——Apriori算法
  • 2.2 分类关联规则的定义与作用
  • 2.2.1 分类关联规则的提出
  • 2.2.2 分类关联规则相关定义
  • 2.3 关联分类算法的发展
  • TFPCMAR关联分类算法'>第三章 AprioriTFPCMAR关联分类算法
  • TFP关联规则挖掘算法关键技术'>3.1 AprioriTFP关联规则挖掘算法关键技术
  • 3.1.1 P树的作用及建构
  • 3.1.2 T树的作用及建构
  • 3.2 CMAR关联分类算法关键技术
  • 3.2.1 规则存储
  • 3.2.2 规则剪枝
  • TFP算法实现CMAR关联分类算法'>3.3 基于AprioriTFP算法实现CMAR关联分类算法
  • TFPCMAR算法思想'>3.3.1 AprioriTFPCMAR算法思想
  • 3.3.2 实验及其结果分析
  • 第四章 基于支持度与置信度阈值优化技术的关联分类算法
  • 4.1 支持度和置信度阈值设置对分类准确率的影响分析
  • 4.2 优化技术设计
  • 4.3 实验及其结果分析
  • 第五章 关联分类规则提取系统的实现
  • 5.1 系统功能框架设计
  • 5.1.1 数据输入模块
  • 5.1.2 数据预处理模块
  • 5.1.3 规则提取模块
  • 5.1.4 显示模块
  • 5.2 系统逻辑单元设计
  • 5.3 系统交互设计
  • 5.4 实验结果
  • 第六章 研究总结与展望
  • 6.1 本文研究总结
  • 6.2 下一步工作计划
  • 附录
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    关联分类算法研究及其系统实现
    下载Doc文档

    猜你喜欢