基于滑动窗口的数据流频繁闭合项集挖掘研究

基于滑动窗口的数据流频繁闭合项集挖掘研究

论文摘要

随着信息技术特别是网络技术飞速发展,人们收集、存贮、传输数据能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值的知识却非常匾乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。频繁模式挖掘是数据挖掘领域的一个基本问题,研究内容一般包括事务、序列、树和图。其方法被广泛应用于许多其它数据挖掘任务中,如相关性分析,周期分析,最大模式,闭合模式,查询,分类,索引等等。由于问题本身的基础性和内在复杂性,频繁模式挖掘方法成为许多研究者关注的课题。如何实时挖掘数据流滑动窗口中的频繁闭合模式集是一个很大的挑战。本文针对数据流的特点,根据Moment算法提出了一种基于频繁闭项集挖掘的增量式维护算法,首先,算法通过滑动窗口来增量更新数据流事务,使用高效的项的位序列表示来降低滑动窗口的时间和空间复杂度。然后,为适应数据流快速、大量的特性,设计了一种新的数据结构New-CFIT,该结构不仅能够增量更新,而且可以快速地挖掘滑动窗口中的所有频繁闭合项集。其次,一种基于散列的技术被用于压缩存储挖掘出来的频繁闭项集。最后,为保证挖掘结果的准确性,利用了一棵压缩的模式树来进行频繁闭项集的检查,其目的是进行两种闭包检查:(1)超集检查,检查新发现的频繁闭项集是否是另一个具有相同支持度的已经发现的闭项集的超集;(2)子集检查,检查新发现的频繁闭项集是否是另一个具有相同支持度的已经发现的闭项集的子集。实验证明,在最近数据流频繁闭项集挖掘上,本文提出的算法与moment算法相比,不仅能得到比较高的准确度,而且执行速度更快,内存占用更小。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 1 引言
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 本文的主要研究工作与组织结构
  • 2 数据流模型与数据流处理技术
  • 2.1 数据流处理模型及划分
  • 2.2 传统数据处理模型和数据流处理模型的比较
  • 2.3 基于数据集的数据流处理技术
  • 2.4 基于滑动窗口模型的处理技术
  • 2.5 本章小节
  • 3 频繁闭项集挖掘算法
  • 3.1 基本概念
  • 3.2 频繁闭项集挖掘算法
  • 3.3 本章小结
  • 4 改进的MOMENT算法(A-MOMENT)
  • 4.1 算法相关定义与项集的位向量表示方法
  • 4.2 基于散列的技术的频繁闭项集计数
  • 4.3 New-CFIT的数据结构与构造
  • 4.4 更新New-CFIT及相应算法
  • 4.5 频繁项集闭包的检查
  • 4.6 频繁闭合项集挖掘算法总结
  • 4.7 本章小结
  • 5 试验结果及分析
  • 5.1 实验环境和测试数据集
  • 5.2 试验结果与分析
  • 5.3 本章小结
  • 6 结束语及未来工作
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于动态窗口的大数据流式处理技术研究[J]. 数字技术与应用 2020(03)
    • [2].基于邻域相似的大数据流滞后相关性挖掘仿真[J]. 计算机仿真 2020(06)
    • [3].数据流技术在汽车维修中的应用探讨[J]. 时代汽车 2019(07)
    • [4].基于大数据的定性数据流聚类优化模型研究[J]. 西安文理学院学报(自然科学版) 2019(04)
    • [5].一种基于数据流的异常值检测改进算法[J]. 中国科技信息 2017(23)
    • [6].云计算中数据流存储负载均衡优化仿真[J]. 计算机仿真 2018(10)
    • [7].大数据流式计算系统综述[J]. 成组技术与生产现代化 2016(04)
    • [8].数据流技术在汽车维修中的应用[J]. 科技展望 2016(16)
    • [9].数据流分类挖掘中的概念变化研究[J]. 计算机科学 2014(S2)
    • [10].浙江传媒学院加快数据治理形成“数据流”[J]. 中国教育网络 2020(Z1)
    • [11].面向非平衡与概念漂移的数据流分类的研究[J]. 现代计算机 2020(04)
    • [12].基于迁移学习的数据流分类研究综述[J]. 天津理工大学学报 2019(03)
    • [13].试分析电网自动化中数据流技术的运用[J]. 电工文摘 2016(06)
    • [14].海量数据流的分类稳定性决策与评判数学模型仿真[J]. 科技通报 2016(02)
    • [15].非平稳数据流下的网络入侵检测优化方法研究[J]. 计算机仿真 2016(09)
    • [16].分布式数据流分类关键技术研究[J]. 华北科技学院学报 2015(04)
    • [17].数据流技术在电喷发动机维修中的应用分析[J]. 湖南农机 2014(05)
    • [18].数据流技术在电网自动化中的应用实践[J]. 电子技术与软件工程 2014(08)
    • [19].数据流技术在汽车维修中的运用[J]. 黑龙江科技信息 2014(26)
    • [20].数据流系统降载研究综述[J]. 计算机应用研究 2008(10)
    • [21].基于协调数据流抢占机制的原理及设计[J]. 电脑与电信 2008(10)
    • [22].基于多维分层采样的时间维度型大数据流整合系统设计[J]. 现代电子技术 2020(05)
    • [23].数据流计算环境下的集群资源管理技术[J]. 大数据 2020(03)
    • [24].大数据流计算特点及“单一窗口”适用场景探讨[J]. 中国口岸科学技术 2020(08)
    • [25].基于自适应微簇的任意形状概念漂移数据流聚类[J]. 计算机应用与软件 2020(11)
    • [26].一种对数据流进行聚类的改进算法[J]. 电子设计工程 2017(22)
    • [27].分布式数据流上的高性能分发策略[J]. 软件学报 2017(03)
    • [28].一种基于质量估算的空间数据流聚类算法研究[J]. 计算机应用研究 2017(09)
    • [29].融合互近邻降噪的动态数据流分类研究[J]. 计算机科学与探索 2016(01)
    • [30].多媒体云计算下的大规模数据流调度方法研究[J]. 现代电子技术 2015(20)

    标签:;  ;  ;  ;  ;  

    基于滑动窗口的数据流频繁闭合项集挖掘研究
    下载Doc文档

    猜你喜欢