时间序列数据流中相关性分析技术的研究

时间序列数据流中相关性分析技术的研究

论文摘要

随着数据库理论研究的广泛深入,许多新的技术应运而生。近年来在传感器网络监控、网络监测、金融数据分析、科学数据处理等多个领域,关于数据流的研究已经成为具有广泛应用前景的新兴课题。由于数据流的特殊性:短时间内有大量数据连续到达,这些数据随时间动态变化。怎样对这些流式数据使用有限存储空间进行快速处理以获取有用信息,为数据挖掘及其应用研究带来了新的机遇和挑战。相似性查询是数据挖掘的一项重要任务,同时也是聚类、分类、频繁模式挖掘和异常检测等其它任务的基础。如何对数据流进行相似性查询已经引起数据库研究领域的广泛关注。本文采用相关性分析作为相似性查询的度量标准,提出了在多个时间序列数据流中进行快速相关性分析的一系列算法。主要工作包括以下几点:(1)提出一种基于布尔表示的数据约减技术。通过简单的转换将原始数据流序列转换为布尔序列,利用布尔序列间的位运算快速获取结果。该方法将原始的数值数据转化为比特位,占用的内存空间极小。(2)在用户提前定义滑动窗口大小的前提下,提出一种分层布尔表示算法HBR,实现多个时间序列数据流的同步相关性分析。该方法将原始数据流序列分别转换为宏布尔序列和微布尔序列,通过布尔序列间的比较即可快速定位候选相关性集合。(3)在同步相关性分析基础上,提出一种高效的滞后相关性分析算法BLC,利用布尔滞后相关技术分析序列之间的滞后相关性,并快速探测滞后时间。(4)在用户没有定义滑动窗口大小的前提下,提出一种窗口大小可调整的自适应性相关性分析算法SACA。利用布尔自相关系数获取原始数据流序列的周期特性,根据周期对多个序列进行分组,然后在每一个分组中完成窗口大小的自适应调整。通过理论分析和实验验证,上述算法在多个时间序列数据流的相关性分析中具有较高的效率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 问题的提出
  • 1.3 解决方法
  • 1.4 论文结构
  • 第二章 相关理论与研究现状
  • 2.1 数据流定义
  • 2.1.1 数据流的特征
  • 2.1.2 数据流的应用
  • 2.2 数据流挖掘技术
  • 2.2.1 聚类
  • 2.2.2 分类
  • 2.2.3 频繁模式发现
  • 2.2.4 异常检测
  • 2.3 时间序列简介
  • 2.3.1 时间序列模型
  • 2.3.2 时间序列分析
  • 2.3.3 相似性查询技术
  • 2.4 本章小结
  • 第三章 滑动窗口下的同步相关性分析
  • 3.1 问题描述
  • 3.2 时间序列数据流的分层布尔表示技术
  • 3.2.1 宏布尔序列
  • 3.2.2 微布尔序列
  • 3.2.3 布尔相关性分析
  • 3.3 基于分层布尔表示的相关性分析
  • 3.3.1 HBR算法
  • 3.3.2 窗口同步滑动的增量式维护
  • 3.4 理论分析
  • 3.4.1 精度分析
  • 3.4.2 复杂性分析
  • 3.5 实验评测
  • 3.5.1 HBR算法的精度评测
  • 3.5.2 HBR算法的处理速率评测
  • 3.6 本章小结
  • 第四章 基于布尔表示的滞后相关性分析
  • 4.1 问题描述
  • 4.1.1 滞后相关性的定义
  • 4.1.2 Braid方法
  • 4.2 布尔表示方法
  • 4.3 布尔滞后相关算法(BLC)
  • 4.4 理论分析
  • 4.4.1 精度分析
  • 4.4.2 复杂性分析
  • 4.5 实验评估
  • 4.5.1 BLC算法的精度评测
  • 4.5.2 BLC算法的处理速率评测
  • 4.6 本章小结
  • 第五章 自适应的相关性分析
  • 5.1 问题描述
  • 5.2 基于布尔表示的周期性探测技术
  • 5.2.1 基本定义
  • 5.2.2 布尔自相关技术
  • 5.3 窗口大小的自适应调整
  • 5.4 理论分析
  • 5.4.1 精度分析
  • 5.4.2 复杂性分析
  • 5.5 实验评测
  • 5.5.1 布尔自相关技术的精度评测
  • 5.5.2 布尔自相关技术的处理速率评测
  • 5.6 本章小结
  • 第六章 结论
  • 6.1 本文主要贡献
  • 6.2 未来工作
  • 参考文献
  • 致谢
  • 攻读硕士学位期间的论文项目情况
  • 相关论文文献

    • [1].基于动态窗口的大数据流式处理技术研究[J]. 数字技术与应用 2020(03)
    • [2].基于邻域相似的大数据流滞后相关性挖掘仿真[J]. 计算机仿真 2020(06)
    • [3].数据流技术在汽车维修中的应用探讨[J]. 时代汽车 2019(07)
    • [4].基于大数据的定性数据流聚类优化模型研究[J]. 西安文理学院学报(自然科学版) 2019(04)
    • [5].一种基于数据流的异常值检测改进算法[J]. 中国科技信息 2017(23)
    • [6].云计算中数据流存储负载均衡优化仿真[J]. 计算机仿真 2018(10)
    • [7].大数据流式计算系统综述[J]. 成组技术与生产现代化 2016(04)
    • [8].数据流技术在汽车维修中的应用[J]. 科技展望 2016(16)
    • [9].数据流分类挖掘中的概念变化研究[J]. 计算机科学 2014(S2)
    • [10].浙江传媒学院加快数据治理形成“数据流”[J]. 中国教育网络 2020(Z1)
    • [11].面向非平衡与概念漂移的数据流分类的研究[J]. 现代计算机 2020(04)
    • [12].基于迁移学习的数据流分类研究综述[J]. 天津理工大学学报 2019(03)
    • [13].试分析电网自动化中数据流技术的运用[J]. 电工文摘 2016(06)
    • [14].海量数据流的分类稳定性决策与评判数学模型仿真[J]. 科技通报 2016(02)
    • [15].非平稳数据流下的网络入侵检测优化方法研究[J]. 计算机仿真 2016(09)
    • [16].分布式数据流分类关键技术研究[J]. 华北科技学院学报 2015(04)
    • [17].数据流技术在电喷发动机维修中的应用分析[J]. 湖南农机 2014(05)
    • [18].数据流技术在电网自动化中的应用实践[J]. 电子技术与软件工程 2014(08)
    • [19].数据流技术在汽车维修中的运用[J]. 黑龙江科技信息 2014(26)
    • [20].数据流系统降载研究综述[J]. 计算机应用研究 2008(10)
    • [21].基于协调数据流抢占机制的原理及设计[J]. 电脑与电信 2008(10)
    • [22].基于多维分层采样的时间维度型大数据流整合系统设计[J]. 现代电子技术 2020(05)
    • [23].数据流计算环境下的集群资源管理技术[J]. 大数据 2020(03)
    • [24].大数据流计算特点及“单一窗口”适用场景探讨[J]. 中国口岸科学技术 2020(08)
    • [25].一种对数据流进行聚类的改进算法[J]. 电子设计工程 2017(22)
    • [26].分布式数据流上的高性能分发策略[J]. 软件学报 2017(03)
    • [27].一种基于质量估算的空间数据流聚类算法研究[J]. 计算机应用研究 2017(09)
    • [28].融合互近邻降噪的动态数据流分类研究[J]. 计算机科学与探索 2016(01)
    • [29].多媒体云计算下的大规模数据流调度方法研究[J]. 现代电子技术 2015(20)
    • [30].一种面向演进数据流的结合相似准则和反例信息的分类方法[J]. 控制与决策 2013(11)

    标签:;  ;  ;  ;  ;  

    时间序列数据流中相关性分析技术的研究
    下载Doc文档

    猜你喜欢