关于时态数据关联规则挖掘的研究

关于时态数据关联规则挖掘的研究

论文摘要

数据挖掘技术自20世纪90年代初期开始崛起,并迅速的成为计算机理论及应用界研究的热点。如今数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、信息检索、高性能计算以及可视化等最新技术的研究成果,成功的打破了“数据丰富,知识贫乏”的局面。在数据挖掘技术蓬勃发展的过程中,人们逐渐意识到时态数据挖掘研究的必要性及其重要意义。因为时间是客观世界的客观属性,是数据的固有属性,在数据挖掘的过程中忽略数据的时态语义已然暴露出很多不足。于是诸如时态数据的模式、趋势、约束、因果关系等时态知识的挖掘得到了越来越多的研究,值得提出的是,计算机学术界对于挖掘时态关联规则给予了尤其多的关注。本文提出的是时态数据库中离散属性的带周期规律的关联规则发现方法。关于时态数据周期性关联规则挖掘的研究也有不少,其中包括连续属性的周期性关联规则提取,定制周期内时态关联规则提取等等。在这些研究成果的基础上,本文提出的方法能够计算得到时态数据库中离散属性的周期,进而通过执行改造了的Apriori算法挖掘周期性时态关联规则。本文所做的主要工作概括如下:1.在对时态数据库中的有效时间属性进行划分和标记的基础上,提出了时态数据库中离散属性的周期计算方法,并详细描述了算法的执行步骤。2.提出新的时间区间标记方法,通过划分和标记时态数据库的有效时间属性,用标记集合代替时间区间,达到有效时间区间合理离散化的目的。3.提出改进了的Apriori算法,在计算频繁项集的过程中,相匹配的项集根据其所携带的时间区间标记的不同来分别计算支持度,从而得到带时态信息的频繁项集。4.计算得到带时态信息的关联规则,结合离散属性的周期,合理解释关联规则的周期规律。5.分析本文提出的改进了的Apriori算法在性能上有所提升的主要原因。本文通过对时态数据库的有效时间属性进行两次划分和标记,有效的实现了离散属性的周期计算以及时间区间的离散化,为进一步执行Apriori算法奠定了基础。另外,本文提出的改进了的Apriori算法使得计算频繁项集的迭代过程迅速收敛,减少了扫描数据库的次数,提高了算法的执行效率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 本文的研究意义和背景
  • 1.1.1 数据挖掘技术产生的背景
  • 1.1.2 时态数据挖掘技术的意义
  • 1.2 国内外相关研究综述
  • 1.3 本文的主要研究内容和结构
  • 第二章 数据挖掘技术综述
  • 2.1 数据库知识发现与数据挖掘
  • 2.2 数据库知识发现过程
  • 2.3 数据挖掘的任务
  • 2.3.1 分类知识发现
  • 2.3.2 数据聚类
  • 2.3.3 关联分析
  • 2.3.4 数据总结
  • 2.3.5 异常发现
  • 2.4 数据挖掘的应用
  • 2.5 数据挖掘的发展趋势及面临的挑战
  • 第三章 时态数据库概述
  • 3.1 时态数据库背景
  • 3.2 时态数据库基本概念
  • 3.2.1 时间粒度与时间量子
  • 3.2.2 时间元素
  • 3.2.3 三种基本时间
  • 3.2.4 几种时态数据库
  • 3.3 时态数据模型
  • 3.4 时态数据挖掘
  • 第四章 普通关联规则挖掘技术和算法
  • 4.1 关联规则的基本概念
  • 4.1.1 研究背景
  • 4.1.2 关联规则定义
  • 4.1.3 关联规则的分类
  • 4.1.4 关联规则发现过程
  • 4.2 关联规则发现算法
  • 4.2.1 Apriori算法
  • 4.2.2 FP-growth算法
  • 第五章 时态数据关联规则挖掘
  • 5.1 时间区间延展与归并技术
  • 5.2 时态数据库中连续属性周期规律与关联规则挖掘
  • 5.3 时态数据库中离散属性周期规律与关联规则挖掘
  • 5.3.1 相关术语定义
  • 5.3.2 算法执行步骤
  • 5.4 实例
  • 5.5 实验结果及分析
  • 第六章 结束语
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文目录
  • 攻读学位期间参加的主要科研项目
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].浅谈时态数据挖掘的相似性发现技术[J]. 电脑迷 2016(09)
    • [2].主从结构的双时态数据模型的设计应用[J]. 智能计算机与应用 2015(02)
    • [3].一种改进的时态数据模型的设计与应用[J]. 计算机时代 2014(07)
    • [4].相似发现技术在时态数据挖掘中的应用[J]. 硅谷 2012(10)
    • [5].基于时态数据挖掘的图书馆建设与服务发展[J]. 科技情报开发与经济 2011(26)
    • [6].时态数据挖掘在图书馆参考咨询工作中的应用[J]. 科技情报开发与经济 2011(25)
    • [7].电子病历中重叠时态数据的分析与消除[J]. 计算机技术与发展 2009(03)
    • [8].分布式多空间数据库复杂时态数据提取技术[J]. 科学技术与工程 2019(12)
    • [9].电子病历中不确定时态数据的时态过滤运算[J]. 计算机系统应用 2008(07)
    • [10].应急系统中时态数据的本体表示与检索研究[J]. 电脑开发与应用 2008(09)
    • [11].基于界址点的地籍时态数据模型[J]. 辽宁工程技术大学学报(自然科学版) 2009(03)
    • [12].应急系统中时态数据的本体表示研究[J]. 科技情报开发与经济 2008(08)
    • [13].双时态数据更新技术的研究[J]. 齐齐哈尔大学学报(自然科学版) 2013(04)
    • [14].一种面向自然语言表达的不确定时态数据的建模方法[J]. 河北科技大学学报 2010(05)
    • [15].时态数据的切片归档技术研究——以地理信息系统数据为例[J]. 档案与建设 2018(06)
    • [16].基于关系数据库实现时态数据库[J]. 电脑开发与应用 2010(07)
    • [17].基于ArcGIS Engine的时态数据可视化[J]. 电脑编程技巧与维护 2017(16)
    • [18].网络营销平台中的时态数据处理[J]. 网络安全技术与应用 2014(11)
    • [19].一种基于线序划分的时态数据索引技术[J]. 计算机科学 2013(01)
    • [20].气象GIS中的气象时态数据模型的设计[J]. 测绘与空间地理信息 2014(05)
    • [21].面向用户的BCDM时态数据的更新研究[J]. 计算机工程与设计 2009(20)
    • [22].Now相关概率不确定时态数据模型[J]. 嘉应学院学报 2009(06)
    • [23].水文时态数据管理与实现[J]. 电脑知识与技术 2012(14)
    • [24].确定学习与基于数据的建模及控制[J]. 自动化学报 2009(06)
    • [25].时态数据索引TDindex研究与应用[J]. 中国科学:信息科学 2015(08)
    • [26].异构信息空间中支持多模态融合实体搜索的多层时态数据模型[J]. 计算机科学 2015(04)
    • [27].研究房产信息系统中的时态数据管理[J]. 通讯世界 2015(09)
    • [28].时态数据完整性约束研究与实现[J]. 计算机科学 2010(11)
    • [29].时态数据挖掘在手机用户消费行为中的应用[J]. 数理统计与管理 2008(01)
    • [30].HBase下时态信息索引策略研究[J]. 广东工业大学学报 2014(03)

    标签:;  ;  ;  ;  ;  

    关于时态数据关联规则挖掘的研究
    下载Doc文档

    猜你喜欢