基于概率密度网格结构的不确定数据流聚类算法研究

基于概率密度网格结构的不确定数据流聚类算法研究

论文摘要

近年来,国内外学者对不确定数据流的聚类问题进行了大量的研究,但仍有不少问题尚待解决。大多数不确定数据流聚类算法不能在线得到精确的聚类结果;现有算法采用固定划分网格的方法,不能有效处理边界点;已有基于网格的算法,对概率密度网格单元缺少有效的存储结构。这些问题的研究对于不确定数据流的聚类分析以及在具体领域的应用都具有重要的意义。首先,为了实现对不确定数据流的在线聚类,提出了一种基于概率密度网格结构的不确定数据流聚类算法。该算法采用计数型滑动窗口,以反映不确定数据流的当前情况。同时,采用概率密度网格的存储结构,以使算法能够发现任意形状的簇。另外,还定义网格概率密度相似度,以实现初始化及更新聚类,提高算法的实时性。其次,为了更好地处理边界点问题,提出了一种基于可调整的概率密度网格结构的不确定数据流聚类算法。该算法采用可调整的概率密度网格技术来处理稀疏网格单元,以提高聚类质量。同时,还定义概率密度网格聚类特征用以存储不确定数据流的概要信息。另外,在概率密度的定义中引入时间衰减因子,以降低历史数据对聚类结果的影响。最后,为了有效存储网格单元,提出了一种基于概率密度网格树的不确定数据流聚类算法。该算法将一种树型概要数据结构引入到不确定数据流聚类算法中。首先把不确定元组按其属性值分配到一棵多叉树中,以消除空网格对聚类结果的影响。同时,设置时间间隔,以提高算法的执行效率。另外,还引入噪音阈值函数,以有效发现噪音叶子节点。本文通过实验对上述提出的算法进行验证,并与已有经典算法进行比较分析。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 不确定数据流挖掘技术
  • 1.1.1 不确定数据流挖掘研究背景和意义
  • 1.1.2 不确定数据流挖掘的任务
  • 1.2 不确定数据流聚类分析研究现状
  • 1.2.1 国内外研究现状
  • 1.2.2 存在的问题
  • 1.3 课题的主要研究内容
  • 1.4 本文的结构安排
  • 第2章 基于概率密度网格结构的不确定数据流在线聚类算法研究
  • 2.1 引言
  • 2.2 问题定义
  • 2.3 PDG-OCUStream聚类算法设计
  • 2.3.1 PDG-OCUStream聚类算法框架
  • 2.3.2 初始化聚类子算法
  • 2.3.3 更新聚类子算法
  • 2.4 本章小结
  • 第3章 基于可调整的概率密度网格结构的不确定数据流聚类算法研究
  • 3.1 引言
  • 3.2 问题定义
  • 3.3 APDG-CUStream算法设计
  • 3.3.1 APDG-CUStream聚类算法框架
  • 3.3.2 初始调整聚类算法
  • 3.4 本章小结
  • 第4章 基于概率密度网格树的不确定数据流聚类算法研究
  • 4.1 引言
  • 4.2 问题定义
  • 4.3 PDGT-CUStream算法设计
  • 4.3.1 时间间隔gap与噪音阈值函数的确定
  • 4.3.2 PDGT-CUStream聚类算法框架
  • 4.3.3 初始化算法和聚类叶子节点算法
  • 4.4 本章小结
  • 第5章 算法实现及性能分析
  • 5.1 实验数据和实验环境
  • 5.2 PDG-OCUStream算法性能分析
  • 5.2.1 PDG-OCUStream算法聚类质量分析
  • 5.2.2 PDG-OCUStream算法执行效率分析
  • 5.2.3 不同概率密度阈值对PDG-OCUStream算法的影响
  • 5.3 APDG-CUStream算法性能分析
  • 5.3.1 APDG-CUStream算法聚类质量分析
  • 5.3.2 APDG-CUStream算法执行效率分析
  • 5.3.3 不同概率密度网格粒度对APDG-CUStream算法的影响
  • 5.4 PDGT-CUStream算法性能分析
  • 5.4.1 PDGT-CUStream算法执行效率分析
  • 5.4.2 不同划分精度对PDGT-CUStream算法的影响
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间承担的科研任务与主要成果
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].一种联系数表达的位置不确定数据流聚类算法[J]. 小型微型计算机系统 2020(02)
    • [2].基于概率分布的不确定数据聚类[J]. 深圳信息职业技术学院学报 2018(05)
    • [3].基于密度的不确定数据流聚类算法[J]. 清华大学学报(自然科学版) 2017(08)
    • [4].基于近邻传播的不确定数据流演化聚类算法[J]. 模式识别与人工智能 2016(05)
    • [5].隐含概念漂移的不确定数据流集成分类算法[J]. 计算机工程与科学 2016(07)
    • [6].一种基于预裁剪的不确定数据流频繁项集挖掘算法[J]. 科学技术与工程 2016(23)
    • [7].大数据环境下的不确定数据流在线分类算法[J]. 东北大学学报(自然科学版) 2016(09)
    • [8].不确定数据流多维建模方法[J]. 国防科技大学学报 2014(05)
    • [9].基于粗糙模糊集的不确定数据流聚类算法[J]. 计算机科学与探索 2014(12)
    • [10].基于概率分布相似性的不确定数据聚类算法研究[J]. 高考 2016(36)
    • [11].障碍空间中基于网格的不确定数据聚类算法[J]. 计算机科学与探索 2019(03)
    • [12].高维不确定数据的子空间聚类算法[J]. 计算机应用 2019(11)
    • [13].不确定数据的有效查询处理评估技术研究[J]. 铜陵职业技术学院学报 2018(03)
    • [14].基于非参数估计与随机模拟的不确定数据流相似性度量方法[J]. 山东农业大学学报(自然科学版) 2017(04)
    • [15].基于自适应快速决策树的不确定数据流概念漂移分类算法[J]. 控制与决策 2016(09)
    • [16].一种存在级不确定数据流聚类算法[J]. 计算机应用与软件 2015(04)
    • [17].一种基于高斯混合模型的不确定数据流聚类方法[J]. 计算机研究与发展 2014(S2)
    • [18].不确定数据流自适应并行连接算法及应用[J]. 电信科学 2012(02)
    • [19].基于频繁密度分布模式的不确定数据流查询方法[J]. 哈尔滨工程大学学报 2018(06)
    • [20].一种面向不确定数据流的聚类算法[J]. 东北大学学报(自然科学版) 2016(12)
    • [21].一种面向多属性不确定数据流的模体发现算法[J]. 电子与信息学报 2017(01)
    • [22].基于小波分析的不确定数据流异常数据检测[J]. 软件导刊 2011(11)
    • [23].障碍空间中基于密度的不确定数据聚类算法[J]. 小型微型计算机系统 2017(12)
    • [24].元组级不确定数据库的概率频繁项集挖掘[J]. 南阳理工学院学报 2018(04)
    • [25].一种面向不确定数据流的模体发现算法[J]. 电子科技大学学报 2017(01)
    • [26].基于免疫原理的不确定数据流聚类算法[J]. 模式识别与人工智能 2012(05)
    • [27].时间序列不确定数据流中异常数据检测方法[J]. 电子设计工程 2011(19)
    • [28].基于优化策略的不确定数据流预测方法[J]. 计算机工程 2011(21)
    • [29].一种不确定数据流聚类算法[J]. 软件学报 2010(09)
    • [30].不确定数据流上的离群点检测处理[J]. 湖南大学学报(自然科学版) 2020(02)

    标签:;  ;  ;  ;  ;  

    基于概率密度网格结构的不确定数据流聚类算法研究
    下载Doc文档

    猜你喜欢