基于相似性分析的时间序列异常检测研究

基于相似性分析的时间序列异常检测研究

论文摘要

随着经济的高速发展和科技的不断进步,人们对各类信息的关注和依赖也日趋增加,如何充分有效地管理和利用这些海量数据、发现这些数据背后隐含的规律和知识,就成为研究者非常关注的问题。作为数据挖掘的重要研究课题之一,时间序列的数据挖掘与预测近几年发展迅速,它将数据挖掘和时间序列联系起来,支持解决发现型问题,以从海量的时间序列数据中挖掘出有价值的、潜在的、未知的知识为目的。本文以时间序列数据的异常检测为主题,分别研究了时间序列的模式表示方法、时间序列的相似性度量、时间序列的异常检测等问题。以下是本文的主要研究工作和成果:(1)基于重要点探测技术的时间序列线性分段算法能较好的保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。本文对该方法进行改进,通过重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在在固定分段数的情况下反映时间序列的主要特征,算法简单快速,整体拟合误差小。(2)提出了一种基于PLR表示的时间序列动态平移模式距离(Dynamic Translation Pattern Distance, DTPD)。该方法由单模式距离(Single Pattern Distance, SPD)和全模式距离(Full Pattern Distance, FPD)两部分组成。单模式距离(SPD)用于比较一个单独模式之间的相似度,而全模式距离(FPD)用于比较模式组之间的相似度,也就是整条时间序列之间的相似度。全模式距离(FPD)采用了和时间序列动态弯曲距离(DTW)相似的动态弯曲思路,将单模式距离(SPD)整合为全模式距离(FPD),并以此作为候选序列之间的相似量度。实验证明,使用该方法对实验数据集进行聚类准确、高效。(3)通过对基于k-近邻局部密度的异常检测LOF方法经行研究,将LOF方法改进后引入时间序列的异常检测中,提出一种基于局部密度的时间序列模式异常检测方法(Local Outlier Factor Based On Pattern, PLOF),该方法利用时间序列的PLR表示对原始时间序列降维,并使用时间序列单模式距离(Single Pattern Distance, SPD)对序列模式进行相似性量度,从而大大减少了原算法运算时间,而且过滤了噪声,从整体上把握了时间序列数据的“异常”模式。实验证明,该方法可准确检测出时间序列异常模式。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.2.1 时间序列的表示
  • 1.2.2 时间序列的相似性量度
  • 1.2.3 时间序列的异常检测
  • 1.3 本文的工作
  • 第2章 时间序列的模式表示
  • 2.1 引言
  • 2.2 时间序列的表示方法
  • 2.2.1 频域表示法
  • 2.2.2 奇异值表示法
  • 2.2.3 符号表示法
  • 2.2.4 分段线性表示法
  • 2.3 基于重要点的固定分段数分段算法
  • 2.3.1 重要点定义
  • 2.3.2 三种重要点距离
  • PIP'>2.3.3 基于重要点的分段算法PLRPIP
  • FPIP'>2.3.4 基于重要点的固定分段数分段算法PLRFPIP
  • 2.4 试验以及结论
  • 2.4.1 实验一
  • 2.4.2 实验二
  • 第3章 时间序列的相似性量度
  • 3.1 引言
  • 3.2 时间序列相似性概念体系
  • 3.3 时间序列相似性量度
  • 3.3.1 Minkowski距离
  • 3.3.2 欧式距离
  • 3.3.3 编辑距离
  • 3.3.4 包络线距离
  • 3.3.5 最大公共子串
  • 3.3.6 DTW距离
  • 3.4 基于PLR的时间序列模式表示
  • 3.4.1 子段的模式表示
  • 3.4.2 全序列模式表示
  • 3.5 时间序列的动态平移模式距离
  • 3.5.1 单模式距离SPD
  • 3.5.2 全模式距离FPD
  • 3.6 实验以及结论
  • 3.6.1 实验一
  • 3.6.2 实验二
  • 第4章 时间序列的异常模式检测
  • 4.1 引言
  • 4.2 时间序列的异常模式
  • 4.3 K-近邻原理
  • 4.3.1 k-近邻距离
  • 4.3.2 k-近邻可达距离
  • 4.3.3 k-局部可达距离
  • 4.3.4 局部异常系数
  • 4.4 时间序列模式异常检测
  • 4.4.1 时间序列数据预处理
  • 4.4.2 模式距离
  • 4.4.3 基于局部密度的时间序列模式异常检测
  • 4.5 PLOF算法优化
  • 4.6 实验与结论
  • Data数据集'>4.6.1 实验一 KeoghData数据集
  • 4.6.2 实验二 心电图ECG数据集
  • 第5章 总结与展望
  • 5.1 研究工作总结
  • 5.2 未来工作展望
  • 参考文献
  • 攻读硕士期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  

    基于相似性分析的时间序列异常检测研究
    下载Doc文档

    猜你喜欢