嵌入频繁子树挖掘研究

嵌入频繁子树挖掘研究

论文摘要

随着计算机与信息技术的发展,人们在日常事务处理和科学研究中积累了大量数据。如何从中提取或“挖掘”用户所需要的信息,是当前信息科学技术领域面临的一大挑战。数据挖掘正是在这样的背景下发展而来。目前,数据挖掘及其应用已经渗透到多个学科,并在人工智能、数据仓库、模式识别、生物信息分析等领域取得了丰硕的成果。频繁模式挖掘是数据挖掘领域中的一个重要问题,其研究范围包括事务、序列、树和图。树作为一种特殊的图结构,有其自身的特点和优势,因此本文选择频繁子树挖掘作为本文的研究方向。论文的主要内容安排如下:首先,本文研究了数据挖掘和频繁模式挖掘的基本概念和性质,并给出了子树模式的相关概念。此外,研究了无序树的结构特点和规范形式,给出了无序树的规范化方法,综合模式增长的子树挖掘策略和无序子树的挖掘策略,提出了无序树的模式增长框架。第二,本文提出用模式增长方法在无序树构成的森林中挖掘嵌入频繁子树.该算法利用规范化方法将无序树化为唯一的表示形式,根据待增长模式的拓扑结构确定其增长点并构造相应的投影库,将挖掘频繁子树模式问题转化为在各投影库中寻找频繁节点的问题。实验表明其具有较高的效率。第三,本文研究了加权支持度的基本概念和性质,比较了传统频繁子树挖掘和加权频繁子树的不同,提出了挖掘加权嵌入频繁子树的新算法。该算法分别以频繁节点和非频繁节点为基础,利用向上模式增长和向下模式增长的方法产生加权频繁子树模式。最后,通过实验对其正确性和有效性进行了验证。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题研究背景
  • 1.2 课题研究现状
  • 1.3 本文主要内容
  • 第2章 相关知识
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘的产生
  • 2.1.2 数据挖掘的过程
  • 2.1.3 数据挖掘的热点问题
  • 2.2 频繁模式挖掘
  • 2.2.1 频繁项集挖掘
  • 2.2.2 序列模式挖掘
  • 2.2.3 频繁子树和频繁子图挖掘
  • 2.3 频繁子树挖掘基本定义
  • 2.3.1 树和森林
  • 2.3.2 子树模式
  • 2.3.3 子树模式挖掘问题
  • 第3章 无序树规范化
  • 3.1 有序树的存储表示
  • 3.2 无序树的存储表示
  • 3.3 无序树的规范化算法
  • 第4章 无序嵌入频繁子树挖掘
  • 4.1 无序嵌入频繁子树挖掘意义
  • 4.2 模式增长的子树挖掘策略
  • 4.2.1 子树模式投影
  • 4.2.2 模式增长过程
  • 4.2.3 子树模式支持度计算
  • 4.3 无序子树的挖掘策略
  • 4.4 无序树的模式增长框架
  • 4.5 无序嵌入频繁子树的算法UEFT
  • 4.6 实验分析
  • 4.6.1 SLEUTH算法简介
  • 4.6.2 实验结果
  • 第5章 加权嵌入频繁子树挖掘
  • 5.1 加权频繁子树的基本概念
  • 5.2 加权频繁子树的挖掘意义
  • 5.3 传统频繁子树和加权频繁子树的对比
  • 5.3.1 传统频繁子树的Apriori性质
  • 5.3.2 加权频繁子树的特殊性
  • 5.3.3 传统频繁子树和加权频繁子树的对比
  • 5.4 基于加权支持度的嵌入频繁子树挖掘方法
  • 5.4.1 频繁节点挖掘过程
  • 5.4.2 非频繁节点挖掘过程
  • 5.5 基于加权支持度的无序嵌入频繁子树挖掘WEFT
  • 5.6 实验分析
  • 结论
  • 1 本文主要工作
  • 2 今后进一步的研究工作
  • 致谢
  • 参考文献
  • 攻读硕士学位期间所发表的论文
  • 相关论文文献

    • [1].书本图与齿轮图的子树计数及渐进密度特性分析[J]. 数学的实践与认识 2020(10)
    • [2].基于图数据的极大频繁子树挖掘算法研究[J]. 微电子学与计算机 2020(10)
    • [3].基于覆盖模式的频繁子树挖掘方法[J]. 计算机应用 2017(09)
    • [4].毛毛和长鼻子树[J]. 快乐语文 2017(Z5)
    • [5].母亲和茶子树[J]. 诗歌月刊 2015(03)
    • [6].江南的碴子树[J]. 辽河 2014(03)
    • [7].鬼才画秀 裙子树[J]. 童话世界(超阅版) 2014(05)
    • [8].极大频繁子树挖掘及其应用[J]. 计算机科学 2008(02)
    • [9].有序树的频繁子树挖掘研究[J]. 广西师范大学学报(自然科学版) 2008(01)
    • [10].动态数据库中的频繁子树挖掘算法[J]. 计算机科学 2011(05)
    • [11].基于频繁子树挖掘算法的网页木马检测技术[J]. 清华大学学报(自然科学版) 2011(10)
    • [12].基于子树约束的最大频繁子树挖掘算法[J]. 现代计算机(专业版) 2010(05)
    • [13].顾客为子树结构的树上反中心选址问题[J]. 数学的实践与认识 2010(19)
    • [14].无序嵌入式频繁子树挖掘算法[J]. 计算机工程 2009(03)
    • [15].两棵树的公共子树查找算法综述[J]. 陕西理工学院学报(自然科学版) 2009(02)
    • [16].一种新的频繁子树挖掘算法研究与实现[J]. 计算机应用与软件 2012(04)
    • [17].一种新的频繁子树增量式更新方法[J]. 计算机应用 2010(05)
    • [18].基于分区的频繁子树挖掘算法研究[J]. 计算机工程与设计 2011(06)
    • [19].数据流中的频繁标记闭子树的批量挖掘[J]. 北京邮电大学学报 2010(05)
    • [20].一棵梅子树[J]. 文学港 2018(10)
    • [21].楝子树的记忆[J]. 当代小说(下) 2010(11)
    • [22].具有最小子树数目的单圈图与双圈图[J]. 江汉大学学报(自然科学版) 2012(01)
    • [23].频繁子树挖掘算法综述[J]. 软件导刊 2009(12)
    • [24].基于频繁依存子树模式的中心词提取方法研究[J]. 中文信息学报 2016(03)
    • [25].基于频繁子树挖掘的供应链优化方法[J]. 中国市场 2008(36)
    • [26].基于频繁子树模式的评价对象抽取[J]. 计算机工程 2017(04)
    • [27].d-子树划分问题[J]. 计算机学报 2010(04)
    • [28].一种基于频繁子树的数据库索引方法[J]. 华中科技大学学报(自然科学版) 2008(03)
    • [29].基于共享子树的组播状态聚合新方法[J]. 系统仿真学报 2008(15)
    • [30].多层子树堆排序任务匹配调度算法[J]. 通信学报 2010(S1)

    标签:;  ;  ;  ;  ;  

    嵌入频繁子树挖掘研究
    下载Doc文档

    猜你喜欢