基于时间序列的图形挖掘

基于时间序列的图形挖掘

论文摘要

随着20世纪末信息社会的到来,出现了海量的数据流、时间序列、图形、社会网络、时空数据、文本数据、Web数据等,从这些海量数据中发现有用的知识是数据挖掘的热点问题。其中由不同时间重复测量得到的值或事件构成了时间序列数据,大量存在于金融、工程实验、气象、医疗、交通等领域。在数据挖掘领域内,对时间序列的关注主要集中在趋势分析、相似性搜索、关联规则发现等问题上。本文以股票数据为例,在综述国内外数据挖掘研究发展概况后,对时间序列的表达、规则发现、相似性搜索等问题进行研究分析,在时间序列的分段符号化表示、相似性搜索算法以及时间序列数据的关联规则发现方面取得了一些成果,主要的研究内容和研究成果如下:1)介绍了数据挖掘分析的基础理论,包括数据挖掘分析过程、时间序列的传统分析和挖掘分析、频繁模式发现、强关联规则等,并对它们进行了深入、系统的学习和分析。2)时间序列的分段线性表示、符号化表示对常用的基于时间序列的分段线性表示方法进行了研究比较,采用基于斜率变化提取特殊点的分段算法,对数据进行压缩,很好的解决了时间序列数据高维度、数据量大的问题;提出了考虑时间因素,基于线段相对斜率的八元模式的符号化表示方法,有效表示了股票价格的涨跌和时间的关系。并用股票数据验证算法,取得较好结果。3)相似性搜索的研究认真研究了时间序列相似性搜索方法,提出了基于分段符号化和最小首差循环链码的快速相似搜索算法,较以前的搜索算法有更高的效率,并且有效地解决了因时间轴上的平移、伸缩、旋转对相似性判断的影响。用股票数据验证,对股票时间序列数据的行业分析有很大帮助。4)关联规则发现的研究对符号化表示后的序列进行关联算法研究、探讨,提出了Apriori和FP-tree相结合的新算法,发现单支和多支股票数据的频繁模式,并生成关联规则。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的研究背景和意义
  • 1.2 时间序列挖掘在国内外研究发展
  • 1.3 本文的主要研究内容
  • 1.4 本文的结构安排
  • 第二章 时间序列数据分析方法
  • 2.1 时间序列数据挖掘的定义及特点
  • 2.1.1 时间序列数据挖掘的定义
  • 2.1.2 时间序列数据挖掘的特点
  • 2.2 时间序列数据挖掘的一般步骤
  • 2.3 传统的时间序列模型
  • 2.3.1 常用的趋势模型
  • 2.3.2 趋势模型的选取
  • 2.3.3 模型的评价与预测
  • 2.4 时间序列数据挖掘的主要方法及技术
  • 2.4.1 时间序列的预测
  • 2.4.2 时间序列相似性搜索方法
  • 2.4.3 时间序列的关联规则挖掘
  • 2.4.4 时间序列数据挖掘需解决的技术难点
  • 第三章 时间序列挖掘的相关算法研究
  • 3.1 时间序列的分段表示
  • 3.1.1 固定窗口的分段表示
  • 3.1.2 基于关键点的分段表示
  • 3.1.3 基于斜率寻找特殊点的分段表示
  • 3.1.4 算法比较
  • 3.2 考虑时间长度的停板规则符号化表示
  • 3.3 时间序列的相似性搜索
  • 3.3.1 基本搜索算法
  • 3.3.2 基于最小首差循环链码的快速搜索算法
  • 3.3.3 搜索算法比较
  • 第四章 时间序列关联规则挖掘算法研究
  • 4.1 时间序列关联分析解决的问题
  • 4.2 时间序列关联规则的相关概念
  • 4.2.1 项目集、事务、事务集
  • 4.2.2 关联规则
  • 4.2.3 支持度、置信度
  • 4.2.4 最小支持度、最小置信度、强关联规则
  • 4.2.5 频繁项集
  • 4.3 时间序列关联规则挖掘的一般步骤
  • 4.4 时间序列关联规则算法
  • 4.4.1 Apriori算法
  • 4.4.2 Apriori算法的一个实例
  • 4.4.3 Apriori的改进算法研究
  • 4.4.4 FP-tree算法
  • 4.4.5 从FP-tree中挖掘频繁模式
  • 4.4.6 FP-tree算法的一个实例
  • 4.4.7 FP-tree算法分析
  • 4.4.8 结合Apriori和FP-tree的考虑时间因素的关联算法
  • 4.4.9 结合Apriori和FP-tree的考虑时间因素的关联算法验证
  • 第五章 基于时间序列图形挖掘系统的实现
  • 5.1 系统的设计目标及开发环境
  • 5.2 系统逻辑设计模型
  • 5.3 基于时间序列图形挖掘系统实现
  • 5.3.1 数据的获取
  • 5.3.2 数据初始化显示
  • 5.3.3 时间序列数据的分段和符号化表示
  • 5.3.4 时间序列的关联规则生成
  • 5.3.5 挖掘结果评估
  • 5.4 基于时间序列图形挖掘系统的运行过程
  • 5.4.1 系统运行界面
  • 5.4.2 系统的实用性
  • 第六章 总结与展望
  • 6.1 本文总结
  • 6.2 工作展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [3].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [4].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [5].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [6].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [7].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [8].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [9].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [10].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [11].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [12].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [13].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [14].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [15].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [16].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [17].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [18].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [19].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [20].浅析数据挖掘[J]. 内江科技 2020(06)
    • [21].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [22].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [23].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [24].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [25].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [26].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [27].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [28].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [29].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [30].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)

    标签:;  ;  ;  ;  ;  

    基于时间序列的图形挖掘
    下载Doc文档

    猜你喜欢