基于正交变换的时间序列索引

基于正交变换的时间序列索引

论文摘要

时间序列的相似性度量和索引查询是数据挖掘技术的关键和基础。本文首先对时间序列数据挖掘技术进行了较系统的文献总结,仔细分析并比较了现有的相关技术,然后,阐述了其中的几个基本问题,即时间序列的降维、相似性度量以及时间序列的索引等,对这些方面的优缺点以及适用范围等进行了说明,然后针对这几个方面,进行了较为深入的研究,提出了基于R*-tree的分层树索引结构以及正交变换的索引方案,并通过实验进行了验证。时间序列数据通常有以下几方面的特点:海量性、复杂性以及噪声干扰等,如果直接在原始序列上进行搜索,则会出现计算量大,并且准确度、可靠性等都难以得到保证。目前,针对时间序列的表示,国内外的研究者已经提出了很多算法。算法的基本步骤首先提取时间序列的特征值或特征矩形,实现数据的降维,然后将提取该时间序列的特征值或特征矩形建立高效的索引结构,从而使时间序列的查询效率得到很大的提高。基于R*-tree的分层树索引结构给出了一种新的时间序列索引结构,将时间序列分段表示,逐段建立不同层次的类R*-tree索引结构。基于该结构给出了相应的插入和查询算法,并在理论上证明,算法在DTW相似性度量意义上,具备非漏报性质。实验结果表明,该算法较传统树状索引结构在维数较高、数据量较大等情况下,具有更高的检索性能。本文简要的回顾一下时间序列变换以及索引技术。通过对R-tree、R*-tree以及X-tree的介绍,呈现出一幅完整而有序的检索结构发展过程图,它们依次都是在上述树状结构的基础之上,针对缺陷的一种完善与扩充,使其具有更高的效率与适用性。基于正交变换的时间序列,首先根据正交多项式提取特征值,然后采用分层索引建立检索树。分层树通过较低的时间复杂度来建立索引结构,算法依旧能保持良好的时空复杂度。同时在理论上证明,文本提出的算法在DTW相似性度量意义上,具备非漏报性质。实验结果表明,与基于离散小波变换和离散傅里叶变换的时间序列相似查询所作的对比实验表明,所提的算法可以获得高的查询效率。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.2 时间序列数据挖掘的研究现状
  • 1.2.1 时间序列的相似性研究现状
  • 1.2.2 时间序列的索引研究现状
  • 1.3 本文的主要工作和论文的组织结构
  • 2 时间序列相关的基本理论
  • 2.1 时间序列
  • 2.2 时间序列降维
  • 2.3 时间序列相似性度量
  • 2.3.1 欧氏距离
  • 2.3.2 DTW距离
  • 2.3.3 最长公共子序列
  • 2.3.4 子序列匹配
  • 2.4 本章总结
  • 3 分层树的索引结构
  • 3.1 概述
  • 3.1.1 相关符号
  • 3.1.2 问题定义
  • 3.2 分层索引算法
  • 3.2.1 分层索引结构定义
  • 3.2.2 分层树插入
  • 3.2.3 分层树查询
  • 3.3 不漏查证明
  • 3.4 实验与结果分析
  • 3.5 本章小结
  • 4 基于正交变换的索引方案
  • 4.1 概述
  • 4.1.1 索引结构分类
  • 4.1.2 时间序列索引
  • 4.2 数据建模
  • 4.3 相似性匹配
  • 4.3.1 建立索引
  • 4.3.2 相似性查询
  • 4.4 不漏查证明
  • 4.5 实验与结果分析
  • 4.6 本章小结
  • 5 总结与展望
  • 5.1 总结
  • 5.2 进一步的工作
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  ;  

    基于正交变换的时间序列索引
    下载Doc文档

    猜你喜欢