基于数据流的关联规则挖掘方法的研究

基于数据流的关联规则挖掘方法的研究

论文摘要

近年来,针对数据流的挖掘研究已成为数据挖掘领域中一个新的研究热点。和传统静态数据库中的数据不同的是,数据流具有连续的、无限性、和实时性的特点,使得传统的频繁模式挖掘算法难以适用。这对挖掘数据流中的知识带来了新的研究挑战。本文主要针对数据流挖掘中的一些问题展开研究,主要内容如下:首先,对数据流挖掘技术及其特点进行了介绍,然后对数据流挖掘的基本概念及其关键问题进行了介绍,最后对数据流挖掘的几个典型算法进行了研究。其次,提出了基于滑动窗口的数据流频繁闭合模式挖掘算法—PCFI算法。该算法通过将滑动窗口分割为若干个基本窗口,以基本窗口为更新单位,使用提出的前缀滑动窗口树PCFI-tree来挖掘基本窗口内的频繁闭合模式。挖掘时,将频繁模式存储到同一PCFI-tree中,同时删除PCFI-tree上过期的及不频繁闭合的模式分支。挖掘和更新滑动窗口中的所有频繁闭合模式是在PCFI-tree中同时进行。这个实验的结果显示,本算法具备较良好的性能。在论文的最后提出了一个在倾斜时间窗口中的数据流最大频繁模式挖掘算法MMFIDS。MMFIDS基于在倾斜时间窗口,在这其中,对数据进行存储和处理采用了位对象数据、位频繁树IFP-tree和存储树PTTW-tree等,由此可以针对数据流中的新老事务的不同作用挖掘出最大频繁模式。本实验结果显示了该算法的良好性能。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 本文研究的目的和意义
  • 1.2 国内外研究现状
  • 1.2.1 数据流管理系统
  • 1.2.2 数据流挖掘技术的相关研究
  • 1.3 本文的组织结构
  • 2 关联规则与数据流挖掘
  • 2.1 关联规则与数据挖掘
  • 2.1.1 关联规则的基本概念
  • 2.1.2 关联规则的分类
  • 2.1.3 关联规则的挖掘步骤
  • 2.1.4 数据挖掘概述
  • 2.2 数据流及数据流挖掘
  • 2.2.1 数据流及其特点
  • 2.2.2 数据流挖掘
  • 2.3 数据流挖掘的发展趋势
  • 2.4 本章小结
  • 3 数据流频繁模式类挖掘技术
  • 3.1 数据流频繁模式类挖掘的基本概念
  • 3.2 数据流频繁模式类挖掘典型算法
  • 3.2.1 Lossy Counting 算法
  • 3.2.2 FP-stream 算法
  • 3.2.3 其他的频繁模式挖掘算法
  • 3.3 数据流频繁闭合模式挖掘
  • 3.3.1 A-close 算法
  • 3.3.2 Closet 和Closet+算法
  • 3.4 数据流最大频繁模式挖掘
  • 3.4.1 DSM-MFI 算法
  • 3.4.2 estDec +算法
  • 3.5 数据流频繁模式类挖掘的发展趋势
  • 3.6 本章小结
  • 4 基于数据流滑动窗口内的频繁闭合模式挖掘
  • 4.1 滑动窗口模型
  • 4.2 PCFI-tree 结构
  • 4.3 数据流频繁模式挖掘PCFI 算法
  • 4.3.1 算法简介
  • 4.3.2 PCFI 算法挖掘策略
  • 4.3.3 PCFI 算法描述
  • 4.4 算法测试与分析
  • 4.4.1 算法结果测试
  • 4.4.2 实验对比分析
  • 4.5 本章小结
  • 5 事务衰减的数据流最大频繁模式挖掘
  • 5.1 倾斜时间窗口模型
  • 5.2 MMFIDS 算法简介
  • 5.2.1 带权的位对象
  • 5.2.2 改进的频繁模式树IFP-tree
  • 5.2.3 前缀倾斜时间窗口树PTTW-tree
  • 5.2.4 数据流最大频繁项集挖掘算法MMFIDS
  • 5.3 算法测试与分析
  • 5.3.1 实验结果分析
  • 5.3.2 实验对比分析
  • 5.4 本章小结
  • 6 结论
  • 6.1 本文总结
  • 6.2 未来工作的展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [3].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [4].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [5].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [6].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [7].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [8].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [9].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [10].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [11].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [12].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [13].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [14].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [15].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [16].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [17].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [18].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [19].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [20].浅析数据挖掘[J]. 内江科技 2020(06)
    • [21].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [22].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [23].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [24].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [25].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [26].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [27].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [28].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [29].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [30].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)

    标签:;  ;  ;  ;  ;  ;  

    基于数据流的关联规则挖掘方法的研究
    下载Doc文档

    猜你喜欢