基于可变滑动窗口的数据流闭合频繁模式挖掘研究

基于可变滑动窗口的数据流闭合频繁模式挖掘研究

论文摘要

数据流频繁闭合模式的挖掘技术应用的普遍性,使得数据流频繁闭合模式挖掘技术的研究受到越来越广泛的重视,特别是在商务决策、知识库方面发挥着很大的作用。由于数据流自身高速、海量、多变、无限等特点,使数据流挖掘遭遇了很大的挑战。一些研究学者采用数据结构存储数据量中的所有项集,滑动窗口机制来挖掘,提出基于滑动窗口的闭合频繁模式挖掘的多种算法,在数据流挖掘领域取得了很大进展。但是这些基于滑动窗口机制的数据流频繁闭合模式挖掘的算法中,由于较多地考虑快速且精确的效果,而较少考虑数据流的时变特性,因此数据流挖掘算法多是在等速的理想数据流环境中的研究,而现实生活中的数据往往不是等速的,研究结果与实际应用的差距给数据流挖掘的研究带来了新的问题。为了寻求解决数据流挖掘中的这些新问题的方法,本文提出可变滑动窗口数据流频繁闭合模式挖掘算法,主要是针对不等速数据流的挖掘算法。这对数据流挖掘算法的实际应用价值方面具有重要意义。为了更好的挖掘不等速数据流,文中首先对数据流,数据流处理系统,数据流频繁模式挖掘及数据流频繁闭合模式挖掘的相关理论性质和挖掘技术进行了深入的理解。其次在对各种数据流频繁闭合模式挖掘的概念和算法理解的基础上,重点分析了DSCFI算法。最后改进了滑动窗口机制,提出可变滑动窗口,针对可变滑动窗口的机制,提出了DS-stream算法,并用人工合成数据集进行实验,对实验结果进行分析。实验结果表明, DS-stream算法在挖掘数据流频繁集上有很好的时间与空间效率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 数据流频繁模式挖掘面临的挑战
  • 1.4 研究内容
  • 1.4.1 滑动窗口的可变性问题
  • 1.4.2 算法分析
  • 1.5 论文组织结构
  • 第2章 数据流挖掘相关技术
  • 2.1 数据流概述
  • 2.1.1 数据流及其特点
  • 2.1.2 数据流的结构
  • 2.1.3 数据流挖掘模型
  • 2.2 数据流挖掘技术
  • 2.2.1 窗口技术
  • 2.2.1.1 界标窗口模型
  • 2.2.1.2 滑动窗口模型
  • 2.2.1.3 衰减窗口模型
  • 2.2.2 直方图
  • 2.2.3 链式抽样
  • 2.2.4 位图
  • 2.2.5 前缀树
  • 2.3 本章小结
  • 第3章 数据流频繁闭项集挖掘
  • 3.1 数据流频繁模式挖掘
  • 3.1.1 关联规则相关概念
  • 3.1.2 频繁模式
  • 3.2 数据流频繁闭项集的挖掘
  • 3.2.1 数学理论基础
  • 3.2.2 闭合项集的概念
  • 3.2.3 闭合项集的性质
  • 3.2.4 频繁闭合项集挖掘
  • 3.2.4.1 频繁闭合项集概念
  • 3.2.4.2 频繁闭合项集挖掘技术
  • 3.3 频繁闭合项集挖掘算法
  • 3.3.1 A-Close 算法
  • 3.3.2 CLOSE+算法
  • 3.3.3 Moment 算法
  • 3.4 本章小结
  • 第4章 基于可变滑动窗口的算法DS-stream
  • 4.1 滑动窗口的改进——可变滑动窗口
  • 4.1.1 可变滑动窗口概述
  • 4.1.2 可变滑动窗口的挖掘
  • 4.2 DSCFI 算法概述
  • 4.2.1 DSCFI 算法的主要思想概述
  • 4.2.2 算法的步骤
  • 4.2.3 算法存在的不足之处
  • 4.3 DS-stream 算法核心
  • 4.3.1 DS-stream 的概要数据结构
  • 4.3.2 构建DS-tree 算法
  • 4.3.3 DS-tree 更新算法
  • 4.3.4 闭合项集挖掘算法
  • 4.4 算法示例分析
  • 4.5 本章小结
  • 第5章 实验分析
  • 5.1 实验环境及实验数据
  • 5.2 实验结果及分析
  • 5.3 本章小结
  • 结束语及未来展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文
  • 详细摘要
  • 相关论文文献

    • [1].一种确定滑动窗口规模的边界距离算法[J]. 计算机科学 2019(S1)
    • [2].基于滑动窗口的云服务可信评估模型优化[J]. 计算机系统应用 2019(07)
    • [3].面向智能调度监测的流计算并行滑动窗口技术[J]. 电网技术 2016(07)
    • [4].数据流滑动窗口降载技术[J]. 科技广场 2009(03)
    • [5].一种基于滑动窗口的边缘计算方法[J]. 中国新通信 2020(05)
    • [6].滑动窗口技术在智能仪表离线交易记录上传中的运用[J]. 计算机测量与控制 2019(08)
    • [7].一种新的滑动窗口网络编码模型与算法研究[J]. 光通信研究 2019(04)
    • [8].基于滑动窗口技术的快速标量乘法[J]. 计算机科学 2012(S1)
    • [9].基于滑动窗口技术的网络节点对可靠性评估[J]. 解放军理工大学学报(自然科学版) 2009(03)
    • [10].滑动窗口多标记传播算法在微博用户聚类的应用[J]. 内江科技 2018(12)
    • [11].云加端的嵌套滑动窗口故障信号在线检测方法研究[J]. 计算机应用研究 2017(12)
    • [12].模幂滑动窗口法分析及加法链在预计算中的应用[J]. 计算机工程 2014(07)
    • [13].滑动窗口连续查询结果存储优化[J]. 计算机科学 2010(06)
    • [14].“灵活”的滑动窗口算法及其计算量的估计[J]. 计算机应用与软件 2008(11)
    • [15].基于滑动窗口法的遥感图像纹理统计信息提取研究[J]. 安徽农业科学 2008(15)
    • [16].一种基于滑动窗口的数据流频繁项集挖掘算法[J]. 计算机应用与软件 2013(01)
    • [17].基于自适应滑动窗口的双色中波红外图像融合方法研究[J]. 红外技术 2013(04)
    • [18].数据流滑动窗口连接的卸载策略研究[J]. 计算机研究与发展 2011(01)
    • [19].云环境下基于双滑动窗口的供应商信任评估机制研究[J]. 微电子学与计算机 2014(06)
    • [20].改进的基于统计学的滑动窗口无参数的累积和算法[J]. 计算机应用 2013(01)
    • [21].基于变尺度滑动窗口的流数据聚类算法[J]. 计算机应用研究 2011(02)
    • [22].一种与缓冲区紧耦合的环形循环滑动窗口的数据流抽取算法[J]. 电子学报 2011(04)
    • [23].基于滑动窗口挖掘数据流高效用项集的有效算法[J]. 哈尔滨工程大学学报 2018(04)
    • [24].在线交易社区中基于滑动窗口的信誉集结模型[J]. 情报杂志 2008(12)
    • [25].面向滑动窗口应用的设计空间探索方法[J]. 计算机辅助设计与图形学学报 2008(05)
    • [26].一种基于渐消因子与滑动窗口的小区域人口预测方法[J]. 人口与社会 2018(01)
    • [27].基于滑动窗口的连续无线网络编码[J]. 计算机应用 2011(09)
    • [28].基于固定宽度滑动窗口的周跳探测与修复的改进方法[J]. 全球定位系统 2009(05)
    • [29].正弦冲击信号双滑动窗口滞算法的数学仿真实验[J]. 昆明冶金高等专科学校学报 2014(03)
    • [30].滑动窗口应用循环展开及其数据通路生成[J]. 计算机学报 2008(06)

    标签:;  ;  ;  ;  

    基于可变滑动窗口的数据流闭合频繁模式挖掘研究
    下载Doc文档

    猜你喜欢