基于数据仓库的关联规则挖掘算法的研究与应用

基于数据仓库的关联规则挖掘算法的研究与应用

论文摘要

在过去的数十年中,无论是商业企业、科研机构或者政府部门,MIS系统(Management Information System,管理信息系统)都被广泛地应用在信息管理上。以事务处理为主的MIS系统在方便数据管理的同时,也积累了海量的、十分繁杂的数据。由于爆炸性增长的数据量与相对贫乏的知识之间的矛盾,使得数据挖掘成为目前国际上信息决策和人工智能领域的最前沿研究方向之一,其中发现大量数据中项集的相关联系的关联规则(Association Rule)挖掘是它的一个重要方向。在本文中,对经典的关联规则算法进行了深入的分析和研究,并对原算法存在的不足之处,提出了一些改进方法,取得了一定的效果,研究内容主要包括;(1)改变了经典算法的单向搜索方法,运用了自顶向下和自底向上相结合的搜索策略。无论项目集数目多少或是最小支持度大小,都能够较快的找到频繁集,实验证明能提高算法的效率。(2)利用自底向上生成的非频繁项目集合来指导自顶向下的降维操作,可减少自顶向下的侯选频繁集的数量。(3)利用矩阵的结构保存事务数据库,减少计算机的I/O操作,利用事务数据库压缩存储的性质对数据进行裁减,提高了对数据遍历的效率。(4)研究了数值属性关联规则的挖掘算法,利用聚类算法来划分区间,然后将划分后的区间映射为布尔属性,最后发现用户感兴趣的关联规则。最后,将理论知识与实践相结合,以学生成绩分析数据仓库为数据源,进行关联规则的挖掘,同时以OLAP等工具对数据进行多维展现,实现数据分析的可视化。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 引言
  • 1.1 课题来源
  • 1.2 选题依据和意义
  • 1.3 论文的研究内容和创新点
  • 1.4 论文的组织结构
  • 第2章 数据仓库与数据挖掘
  • 2.1 数据仓库
  • 2.1.1 数据仓库的定义与特征
  • 2.1.2 数据仓库的体系结构
  • 2.1.3 数据仓库逻辑模型设计
  • 2.2 数据挖掘
  • 2.2.1 数据挖掘的步骤
  • 2.2.2 数据挖掘的分类
  • 2.3 数据仓库与数据挖掘的关系
  • 2.4 小结
  • 第3章 关联规则挖掘算法
  • 3.1 关联规则
  • 3.1.1 关联规则的基本概念
  • 3.1.2 关联挖掘算法的相关定义
  • 3.1.3 关联挖掘的分类
  • 3.1.4 关联挖掘的主要研究方向和经典算法
  • 3.2 Apriori算法
  • 3.2.1 Apriori算法的解释
  • 3.2.2 Apriori算法的描述
  • 3.2.3 Apriori算法的局限性
  • 3.3 小结
  • 第4章 关联规则挖掘算法的改进
  • 4.1 引言
  • -d算法所采用的改进方法'>4.2 Apriori-d算法所采用的改进方法
  • -d的频繁项目集发现策略'>4.2.1 Apriori-d的频繁项目集发现策略
  • -d中的数据库存储策略'>4.2.2 Apriori-d中的数据库存储策略
  • -d中的项目剪枝技术'>4.2.3 Apriori-d中的项目剪枝技术
  • 4.2.4 自顶向下的快速降维技术
  • -d算法设计'>4.3 Apriori-d算法设计
  • -d的算法描述'>4.3.1 Apriori-d的算法描述
  • -d的主要伪码'>4.3.2 Apriori-d的主要伪码
  • -d算法与Apriori算法的分析与比较'>4.3.3 Apriori-d算法与Apriori算法的分析与比较
  • 4.4 小结
  • 第5章 关联规则挖掘算法量化策略
  • 5.1 量化关联规则算法的相关定义
  • 5.2 关联规则挖掘算法的量化策略
  • 5.3 量化关联规则挖掘算法的设计
  • 5.3.1 量化关联规则挖掘算法的详细描述
  • 5.3.2 量化关联规则挖掘算法的主要伪码
  • 5.4 小结
  • 第6章 成绩挖掘与分析实例
  • 6.1 数据选取
  • 6.2 多维数据视图的建立与展现
  • 6.2.1 OLAP多维数据视图的建立
  • 6.2.2 成绩分析多维数据集的展现
  • 6.3 数值型数据的量化
  • 6.3.1 数据型数据的区间化分
  • 6.3.2 数据型数据的转换
  • -d算法在成绩分析中的应用'>6.4 Apriori-d算法在成绩分析中的应用
  • 6.4.1 系统的实现平台与关键类
  • 6.4.2 用户界面
  • 6.4.3 挖掘实例与结果分析
  • 6.4.4 改进的关联规则挖掘算法的优越性
  • 6.5 小节
  • 第7章 结论与展望
  • 7.1 结论
  • 7.2 进一步的工作
  • 致谢
  • 参考文献
  • 攻读学位期间的研究成果
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  ;  ;  

    基于数据仓库的关联规则挖掘算法的研究与应用
    下载Doc文档

    猜你喜欢