高校学生信息的数据挖掘研究

高校学生信息的数据挖掘研究

论文摘要

数据库技术的逐渐成熟、网络技术的迅速普及和计算机硬件的不断更新,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。为增强人们对这些海量数据的理解能力,数据挖掘技术近年来得到了快速发展。关联规则挖掘是数据挖掘的重要内容之一,1993年由Agrawal等人提出,它最初是以分析事务数据库中项与项之间联系为目标,后来的研究者们对问题原型进行多方面的改进和扩充。目前,关联规则挖掘技术已经被应用到商业、电讯、金融、农业、医疗等领域,取得了良好的效果。关系数据库是众多行业和部门用于存储其生产、管理和科研等大量信息的重要形式,数据量的增长极为迅速。积极研究在关系数据库中挖掘关联规则的有效技术具有极为广阔的发展前景。关系数据库中隐含的关联规则通常具有多维性、多值性和多概念层性,比事务数据库中的布尔型关联规则更加复杂。本文在对Apriori,SETM等事务数据库中布尔型关联规则的典型算法进行分析后,提出了一种关系数据库中关联规则挖掘算法。该算法的核心是利用SQL语言的聚集查询和连接等语句对关系数据库进行操作,完成频繁谓词集和强规则的搜索过程。由于SQL语言对关系数据库操作的高效性和算法与数据库管理系统的紧密性,所以算法具有较高的挖掘效率。在以上研究的基础上,本文介绍了一个常用的的挖掘工具。将该工具在高校领域里的应用谈谈自己的一些看法,并结合安徽理工大学部分学生数据进行挖掘,设计出几种挖掘模型,希望从中能挖掘出相关的知识和规则。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 数据挖掘的兴起
  • 1.2 数据挖掘综述
  • 1.2.1 数据挖掘的基本概念
  • 1.2.2 数据挖掘的方法和过程
  • 1.2.3 数据挖掘技术分类
  • 1.2.4 挖掘的发展趋势
  • 1.3 本文的主要研究方向及内容概要
  • 2 关联规则挖掘
  • 2.1 规则挖掘的基本概念
  • 2.1.1 规则挖掘问题描述
  • 2.1.2 规则的种类
  • 2.2 关联规则挖掘的研究现状
  • 2.2.1 关联规则挖掘的算法
  • 2.2.2 关联规则挖掘问题的扩展
  • 2.2.3 关联规则挖掘的应用
  • 2.3 事务数据库中布尔型关联规则挖掘的经典算法
  • 2.3.1 SETM算法
  • 2.3.2 Apriori算法
  • 2.4 小结
  • 3 关系数据库中关联规则挖掘算法
  • 3.1 关系数据库中的关联规则
  • 3.1.1 关系数据库的结构特点
  • 3.1.2 关系数据库中的关联规则
  • 3.2 关系数据库中关联规则挖掘的研究现状
  • 3.2.1 数值属性的离散化处理方法
  • 3.2.2 关系数据库中关联规则挖掘的两种思路
  • 3.3 小结
  • 4 一种高效的关联规则挖掘算法及采用改进的Apriori算法
  • 4.1 一种高效的关联规则挖掘算法
  • 4.1.1 算法的核心思想
  • 4.1.2 算法的描述
  • 4.2 算法性能分析
  • 4.2.1 算法的正确性
  • 4.2.2 影响算法效率的因素
  • 4.2.3 挖掘测试结果
  • 4.2.4 算法性能比较、缺陷及解决方案
  • 4.3 采用的改进的Apriori算法(Adapted Apriori)
  • 4.3.1 采用的改进的Apriori算法
  • 4.3.2 Adapted Apriori算法描述:
  • 4.4 本章小结
  • 5 关联规则挖掘算法在高校部分学生数据中的挖掘与应用
  • 5.1 采用的数据挖掘工具简介:
  • 5.1.1 SPSS clementine10.0 工具简易挖掘过程和常识简介
  • 5.1.2 数据挖掘简单过程例子
  • 5.2 主要部件及挖掘过程
  • 5.2.1 数据库
  • 5.2.2 学生数据表数据引擎、数据挖掘模式、挖掘结果
  • 5.3 挖掘结果比较、缺陷及解决方案
  • 5.4 小结
  • 6 结论与展望
  • 参考文献
  • 致谢
  • 作者简介及读研期间主要科研成果
  • 相关论文文献

    • [1].分布式事务数据库系统评估体系[J]. 信息通信技术与政策 2019(05)
    • [2].分布式事务数据库评测体系研究与实践[J]. 中国金融电脑 2018(01)
    • [3].超市事务数据库中的关联规则的探讨[J]. 考试周刊 2008(41)
    • [4].热璞科技 分布式事务数据库基础软件[J]. 创业邦 2018(12)
    • [5].超市事务数据库挖掘关联规则的设计[J]. 时代经贸(下旬刊) 2008(04)
    • [6].基于Voronoi图的空间事务数据库构建方法研究[J]. 测绘科学 2009(02)
    • [7].一种基于SFP树的快速关联规则挖掘算法[J]. 计算机技术与发展 2011(05)
    • [8].寿险事务数据库挖掘关联规则的分析和设计[J]. 科技资讯 2008(16)
    • [9].基于数据库划分的关联规则算法[J]. 计算机工程与设计 2008(12)
    • [10].基于最大频繁项集挖掘的微博炒作群体发现方法[J]. 计算机工程与应用 2017(04)
    • [11].一种改进的关联规则挖掘算法研究[J]. 广东第二师范学院学报 2018(03)
    • [12].基于小生境遗传算法的关联规则挖掘方法[J]. 计算机工程 2008(10)
    • [13].可能世界语义下的概率频繁项集挖掘[J]. 新余学院学报 2016(01)
    • [14].基于事务粒的Apriori改进算法[J]. 洛阳师范学院学报 2015(08)
    • [15].一种基于单事务项集组合的频繁项集挖掘算法[J]. 计算机科学 2008(01)
    • [16].基于聚类分析和Apriori算法的个性化推荐研究[J]. 电子技术与软件工程 2020(14)
    • [17].一种针对大型事务数据库的关联规则挖掘算法[J]. 空军雷达学院学报 2011(03)
    • [18].一种改进的Apriori算法[J]. 软件导刊 2010(01)
    • [19].一种优化的Apriori算法[J]. 计算机系统应用 2008(01)
    • [20].采用布尔映射矩阵的Apriori算法改进研究[J]. 福建电脑 2020(03)
    • [21].基于关联规则分析的“购物篮分析”模型的研究[J]. 北京工商大学学报(社会科学版) 2008(04)
    • [22].关联规则挖掘的PredictiveApriori算法的研究及改进[J]. 四川大学学报(自然科学版) 2012(01)
    • [23].改进的Apriori算法在个性化推荐中的应用[J]. 通讯世界 2020(06)
    • [24].一种改进的关联规则Apriori挖掘算法[J]. 深圳信息职业技术学院学报 2011(01)
    • [25].基于事务标识符序列的频繁集发现方法[J]. 安阳工学院学报 2008(02)
    • [26].基于分区的关联规则Apriori算法研究[J]. 科技视界 2015(28)
    • [27].一种引入索引加速挖掘关联规则的高效算法[J]. 计算机工程与科学 2009(04)
    • [28].数据中心特征失真下的深度挖掘算法研究[J]. 科技通报 2013(12)
    • [29].邻接矩阵在高校图书馆借阅数据挖掘中的应用[J]. 现代情报 2011(08)
    • [30].基于隐私保护的关联规则挖掘算法[J]. 计算机与数字工程 2010(08)

    标签:;  ;  ;  ;  ;  ;  

    高校学生信息的数据挖掘研究
    下载Doc文档

    猜你喜欢