基于聚类分区的序列模式挖掘算法研究

基于聚类分区的序列模式挖掘算法研究

论文摘要

信息技术的日新月异使得各个领域的数据量激增,在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。序列模式发现是其中的一个重要研究课题。数据规模的增大对挖掘算法提出了更高的要求。本文针对目前序列模式发现研究中的一些问题展开研究,主要研究工作如下:(1)详细讨论了序列模式的基本模型以及经典的发现方法,展现了序列模式发现研究领域的应用前景及所面临的挑战。(2)针对PrefixSpan算法产生的投影数据库花费较多的存储空间及扫描时间,提出PSD算法,舍弃了对非频繁项的存储及对投影序列数小于最小支持数的投影数据库的扫描,减少了不必要的存储空间,提高了查询速度。实验证明,PSD算法比PrefixSpan算法具有更好的时空性能。(3)对较大数据集挖掘序列模式,提出基于分区的序列模式挖掘算法,以期克服有限存储问题,为并行处理及分布式处理做好基础。此外,当给出的分区数固定时,不同的分区性能可能存在较大差异,本文通过聚类方法对数据集预处理,以得到可以产生较少局部频繁序列的特定分区,最终得到较少的全局候选序列以减少第二遍扫描时间。理论分析和实验表明,本文所提出的方法可比普通分区方法得到更加优化的分区从而效率更高。

论文目录

  • 摘要
  • ABSTRACT
  • 致谢
  • 第一章 绪论
  • 1.1 数据挖掘概述
  • 1.1.1 数据挖掘的发展
  • 1.1.2 数据挖掘的概念
  • 1.1.3 数据挖掘的任务
  • 1.1.4 数据挖掘的热点
  • 1.2 序列模式挖掘技术
  • 1.2.1 序列模式的提出
  • 1.2.2 序列模式的研究概况
  • 1.3 本文的内容与组织
  • 第二章 序列模式概述
  • 2.1 序列模式的定义
  • 2.2 序列模式与关联规则的比较
  • 2.2.1 关联规则概述
  • 2.2.2 序列模式与关联规则的比较
  • 2.3 序列模式挖掘算法
  • 2.3.1 AprioriAll算法
  • 2.3.2 GSP算法
  • 2.3.3 PrefixSpan算法
  • 2.4 本章小结
  • 第三章 基于 PrefixSpan算法的改进算法 PSD的研究
  • 3.1 PSD算法
  • 3.1.1 PSD算法描述
  • 3.1.2 实例说明
  • 3.2 实验分析
  • 3.2.1 实验数据
  • 3.2.2 实验结果
  • 3.3 本章小结
  • 第四章 基于聚类预处理分区的序列模式挖掘研究
  • 4.1 聚类概述
  • 4.2 基于聚类预处理分区的序列模式挖掘算法
  • 4.2.1 分区算法概述
  • 4.2.2 基于聚类预处理分区的序列模式挖掘算法描述
  • 4.2.3 实例说明
  • 4.3 实验分析
  • 4.4 本章小结
  • 第五章 结束语
  • 5.1 工作总结
  • 5.2 工作展望
  • 参考文献
  • 附录一 攻读硕士学位期间发表论文
  • 相关论文文献

    • [1].序列模式挖掘在心理危机干预技能评估中的应用[J]. 上海交通大学学报(医学版) 2020(03)
    • [2].序列模式中的生成序列模式挖掘综述[J]. 无线通信技术 2018(04)
    • [3].增量序列模式挖掘研究进展[J]. 网络安全技术与应用 2017(01)
    • [4].间隙约束序列模式挖掘的对比研究[J]. 网络安全技术与应用 2017(02)
    • [5].序列模式挖掘两种典型算法的研究[J]. 信息技术 2016(11)
    • [6].满足非重叠条件的带有通配符序列模式挖掘[J]. 小型微型计算机系统 2017(05)
    • [7].基于位置信息的显露序列模式挖掘研究[J]. 计算机科学 2017(07)
    • [8].序列模式挖掘在教学管理上的运用[J]. 电脑知识与技术 2016(13)
    • [9].负序列模式挖掘研究[J]. 廊坊师范学院学报(自然科学版) 2015(03)
    • [10].序列模式挖掘技术在数字图书馆中的应用[J]. 农业图书情报学刊 2015(07)
    • [11].一种最有趣的序列模式挖掘算法[J]. 计算机仿真 2019(04)
    • [12].考虑价格的跨种类模糊序列模式挖掘算法[J]. 计算机应用研究 2018(01)
    • [13].水质时间序列模式挖掘[J]. 计算机技术与发展 2018(05)
    • [14].基于频繁序列模式挖掘的反恐情报关联分析[J]. 情报理论与实践 2018(10)
    • [15].序列模式挖掘在通信网络告警预测中的应用[J]. 计算机科学 2018(S2)
    • [16].闭合负序列模式挖掘[J]. 哈尔滨师范大学自然科学学报 2015(06)
    • [17].多维序列模式挖掘算法分析[J]. 赤峰学院学报(自然科学版) 2014(07)
    • [18].基于序列模式挖掘的读者借阅行为分析[J]. 图书情报知识 2011(04)
    • [19].序列模式挖掘综述[J]. 计算机应用研究 2008(07)
    • [20].多支持度下用户行为序列模式挖掘方法研究[J]. 计算机应用与软件 2018(01)
    • [21].基于隐私保护的序列模式挖掘[J]. 计算机科学 2016(12)
    • [22].基于支持量的并发序列模式挖掘方法[J]. 计算机工程与设计 2016(01)
    • [23].基于序列模式挖掘的基因剪接位点[J]. 数据采集与处理 2016(05)
    • [24].一种基于逻辑的频繁序列模式挖掘算法[J]. 计算机科学 2015(05)
    • [25].高效的稀有序列模式挖掘方法[J]. 计算机科学与探索 2015(04)
    • [26].时态数据中序列模式挖掘研究[J]. 科技创新导报 2014(13)
    • [27].序列模式挖掘在教学管理上的应用[J]. 计算机与现代化 2012(11)
    • [28].一种模糊序列模式挖掘的有效方法[J]. 现代计算机(专业版) 2010(13)
    • [29].并发序列模式挖掘方法研究[J]. 计算机应用 2009(11)
    • [30].序列模式挖掘算法在高血压治疗中的研究[J]. 计算机工程与设计 2018(03)

    标签:;  ;  ;  ;  ;  

    基于聚类分区的序列模式挖掘算法研究
    下载Doc文档

    猜你喜欢