基于聚类和压缩矩阵的Apriori算法的研究与应用

基于聚类和压缩矩阵的Apriori算法的研究与应用

论文摘要

自从20世纪80年代后期数据挖掘理论出现以来,数据挖掘技术有了突飞猛进的发展。随着数据量大量增加,数据挖掘技术变得越来越重要,从而引起了众多研究人员的兴趣,数据挖掘迅速扩展到各个领域。数据挖掘作为一种用于从大规模数据集中提取潜在有用的信息和知识的技术,得到越来越广泛的研究和应用。关联规则挖掘是一种重要的数据挖掘技术,其主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,即关联规则。针对关联规则经典算法Apriori算法的缺点已有许多学者做出改进,本文在已有改进算法的基础上,设计了一种基于聚类和压缩矩阵(Cluster&Compression Matrix)的Apriori改进算法- CCMApriori算法。论文的主要内容如下:(1)对数据仓库和数据挖掘技术进行阐述和归纳,重点介绍了聚类分析和关联规则的基本概念、思想及代表算法,并分析了算法的优缺点。(2)运用聚类分析和布尔向量的关系运算思想,设计了一种基于聚类和压缩矩阵的Apriori改进算法- CCMApriori算法。该算法通过聚类和对相同事务的计数来压缩矩阵以减小数据库规模,并且只需扫描一次数据库,无需产生候选项集直接生成频繁项集,较大地提高了算法的效率。(3)在原有的高校教务管理系统中,运用数据仓库和CCMApriori算法,根据学生成绩和历史选课记录预测学生选修的课程和人数,实现了选修课决策支持系统,为学院选修课的开设提供决策支持。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 选题的依据和意义
  • 1.3 论文所作工作及创新点
  • 1.4 本文组织结构
  • 第二章 数据仓库和数据挖掘基础理论
  • 2.1 数据仓库理论基础
  • 2.1.1 数据仓库基本概念
  • 2.1.2 数据仓库系统结构
  • 2.1.3 数据仓库组成
  • 2.1.4 数据仓库与数据库的关系
  • 2.2 数据挖掘技术
  • 2.2.1 数据挖掘的定义和过程
  • 2.2.2 数据挖掘特点
  • 2.2.3 数据挖掘的主要研究内容
  • 2.2.4 数据挖掘的常用方法
  • 2.2.5 数据挖掘当前热点
  • 2.2.6 数据挖掘未来研究方向
  • 第三章 聚类和关联规则基础理论
  • 3.1 聚类分析
  • 3.1.1 聚类分析的数据类型
  • 3.1.2 主要聚类算法
  • 3.1.3 K-Means算法
  • 3.2 关联规则
  • 3.2.1 基本概念
  • 3.2.2 关联规则挖掘的分类
  • 3.2.3 关联规则研究方向
  • 3.2.4 关联规则挖掘步骤
  • 3.2.5 Apriori算法
  • 3.2.6 FP-growth算法
  • 第四章 基于聚类和压缩矩阵的Apriori改进算法
  • Apriori算法'>4.1 CCMApriori算法
  • Apriori算法实例'>4.2 Apriori算法与CCMApriori算法实例
  • Apriori算法与Apriori算法及FP-growth算法性能比较'>4.3 CCMApriori算法与Apriori算法及FP-growth算法性能比较
  • Apriori算法在高校教务系统中的应用'>第五章 CCMApriori算法在高校教务系统中的应用
  • 5.1 系统研究背景和意义
  • 5.2 系统开发说明
  • 5.3 选修课决策系统挖掘模型
  • 5.4 系统实现与结果分析
  • 5.4.1 关联规则挖掘的实现
  • 5.4.2 选修课程决策分析的实现
  • 5.4.3 成绩查询分析的实现
  • 第六章 总结与展望
  • 6.1 总结
  • 6.1.1 本文主要工作及成果
  • 6.1.2 研究和开发方面的不足
  • 6.2 展望
  • 参考文献
  • 攻读硕士学位期间公开发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于Apriori算法的船用物联网多来源数据深度挖掘方法[J]. 舰船科学技术 2019(24)
    • [2].基于二维云模型和Apriori算法的围岩稳定性分级研究[J]. 铁道学报 2020(06)
    • [3].基于Apriori关联分析的煤层气压裂效果主控因素识别[J]. 油气藏评价与开发 2020(04)
    • [4].基于Apriori算法综合管廊火灾识别预警系统[J]. 消防科学与技术 2020(04)
    • [5].基于Apriori算法分析米面制品营养标签使用关联规则[J]. 食品安全质量检测学报 2020(19)
    • [6].基于Apriori的科研考核信息的关联性分析[J]. 辽宁高职学报 2020(10)
    • [7].基于改进Apriori算法的地面空调间歇故障预测[J]. 计算机应用 2016(12)
    • [8].基于关联规则Apriori算法的心肺性职业病病情分析及预测[J]. 中国数字医学 2017(04)
    • [9].基于Apriori算法校园网络安全系统设计[J]. 网络安全技术与应用 2017(03)
    • [10].基于Apriori算法的慢性阻塞性肺疾病超限住院费用关联规则数据挖掘[J]. 中国慢性病预防与控制 2017(04)
    • [11].Apriori算法在无纸化考试系统中的应用[J]. 电脑编程技巧与维护 2016(10)
    • [12].Apriori算法在无纸化考试系统中的应用和改进[J]. 周口师范学院学报 2015(02)
    • [13].基于关联规则Apriori算法的真实世界中结肠恶性肿瘤患者的中西药联合应用特征研究[J]. 中药药理与临床 2019(05)
    • [14].最小支持度为区间值的加权Apriori算法[J]. 辽宁工程技术大学学报(自然科学版) 2016(12)
    • [15].基于关联规则Apriori算法的真实世界复方苦参注射液治疗恶性肿瘤西药联合应用特征研究[J]. 中南药学 2016(12)
    • [16].基于Apriori算法的高校学生综合测评数据挖掘[J]. 现代计算机(专业版) 2017(01)
    • [17].基于Apriori关联规则的电能表检定质量影响因素分析[J]. 电测与仪表 2017(13)
    • [18].基于优化Apriori算法的中风病证治规律研究[J]. 医学信息学杂志 2017(07)
    • [19].数据挖掘中改进的Apriori算法的应用[J]. 信息记录材料 2017(01)
    • [20].基于Apriori的序列模式挖掘算法的研究[J]. 软件 2014(09)
    • [21].Apriori算法在学生信息管理系统中应用研究[J]. 电子制作 2014(24)
    • [22].网络审计系统中Apriori算法的应用与研究[J]. 科技视界 2015(29)
    • [23].基于Apriori改进算法的中药处方分析技术[J]. 西部中医药 2014(05)
    • [24].Apriori算法在杉木伴生树种选择中的应用[J]. 福建农林大学学报(自然科学版) 2008(01)
    • [25].基于Apriori关联规则临床癌性疲乏处方组方及用药规律分析[J]. 亚太传统医药 2016(21)
    • [26].Apriori算法在词性标注规则获取中的应用[J]. 计算机时代 2016(10)
    • [27].基于Apriori关联规则的城市快速路拥堵关联分析[J]. 黑龙江科技信息 2014(33)
    • [28].基于Apriori算法挖掘经验方的“前N组”法[J]. 光明中医 2015(06)
    • [29].基于十字链表的Apriori算法的实现[J]. 赤峰学院学报(自然科学版) 2012(18)
    • [30].基于Apriori算法的网上超市产品组合研究[J]. 福建电脑 2008(01)

    标签:;  ;  ;  ;  ;  

    基于聚类和压缩矩阵的Apriori算法的研究与应用
    下载Doc文档

    猜你喜欢