基于密度的不确定数据流聚类算法的研究与实现

基于密度的不确定数据流聚类算法的研究与实现

论文摘要

近年来,随着网络和作用于网络设备的迅速发展及应用,使大量不确定数据流进入人们的商业应用和学术研究中。例如无线传感器网络WSN(Wireless Sensor Networks)、射频识别RFID(Radio Frequency Identification)等技术的快速发展使大量不确定流数据应运而生。针对不确定数据流环境的聚类分析有着十分重要的应用前景,已经成为当前的研究热点。然而已有的面向静态数据或确定数据流的聚类分析算法已不能满足当前需求。因此开展不确定数据流聚类算法的研究势在必行。在不确定数据流中,数据的不确定性给聚类算法在利用数据信息问题上提出了极大的挑战,首先,简单的计算期望距离将无法得到高质量的聚类结果;其次,现有的数据流聚类算法大多使用标界窗口或类似标界窗口,往往只简单删除最久未更新的簇,因此无法高效处理演化数据流以及分析近期数据的聚类细节;最后,基于划分的流数据聚类算法大多只能形成球形簇,无法针对不同数据分布情况形成任意形状的簇。基于此,本文对不确定数据流环境下基于密度的聚类算法展开研究。首先,本文提出不确定度的概念以衡量不确定数据的分布信息,并通过改进面向确定数据的聚类算法DENCLUE,使其可以处理附带不确定度的不确定数据,以尽量降低数据的不确定性对聚类结果产生的影响。其次,提出在滑动窗口下的基于密度的不确定数据流聚类算法USDENCLUE,并通过聚类特征指数直方图技术实现其快速的删减功能,使其在分析特定时间窗口的聚类细节的同时可以高效的处理噪音数据、演化数据流以及生成任意形状的簇以提高聚类质量。最后,采用真实数据集以及人工合成数据集并与著名的Clustream聚类算法进行比较,实验结果表明USDENCLUE聚类算法在处理不确定数据流时具有良好的聚类效果,并且可以有效的处理噪音数据及演化数据流。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究现状
  • 1.3 数据流聚类技术面临的挑战
  • 1.4 本文主要贡献
  • 第2章 相关研究工作概述
  • 2.1 确定数据聚类概述
  • 2.1.1 静态数据聚类算法
  • 2.1.2 数据流聚类算法
  • 2.2 不确定数据聚类概述
  • 2.2.1 不确定数据产生原因
  • 2.2.2 不确定数据模型
  • 2.2.3 不确定数据聚类算法
  • 2.2.4 不确定数据流聚类算法
  • 2.3 本章小结
  • 第3章 基于密度的不确定数据流聚类算法
  • 3.1 不确定数据的相关问题
  • 3.1.1 数据模型
  • 3.1.2 数据的不确定性对聚类结果的影响
  • 3.1.3 数据不确定度的定义
  • 3.2 不确定数据聚类算法UDENCLUE
  • 3.2.1 相关概念及定义
  • 3.2.2 不确定影响函数
  • 3.2.3 算法描述
  • 3.2.4 本地不确定元组密度
  • 3.3 基于密度的不确定数据流聚类算法USDENCLUE
  • 3.3.1 数据流滑动窗口概念及相关问题
  • 3.3.2 微簇结构的相关定义
  • 3.3.3 算法描述
  • 3.4 本章小结
  • 第4章 实验及结果分析
  • 4.1 实验环境
  • 4.2 数据集
  • 4.3 实验分析
  • 4.3.1 算法有效性
  • 4.3.2 数据不确定度
  • 4.3.3 噪音数据
  • 4.3.4 处理演化数据流
  • 4.4 本章小结
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].一种联系数表达的位置不确定数据流聚类算法[J]. 小型微型计算机系统 2020(02)
    • [2].基于概率分布的不确定数据聚类[J]. 深圳信息职业技术学院学报 2018(05)
    • [3].基于密度的不确定数据流聚类算法[J]. 清华大学学报(自然科学版) 2017(08)
    • [4].基于近邻传播的不确定数据流演化聚类算法[J]. 模式识别与人工智能 2016(05)
    • [5].隐含概念漂移的不确定数据流集成分类算法[J]. 计算机工程与科学 2016(07)
    • [6].一种基于预裁剪的不确定数据流频繁项集挖掘算法[J]. 科学技术与工程 2016(23)
    • [7].大数据环境下的不确定数据流在线分类算法[J]. 东北大学学报(自然科学版) 2016(09)
    • [8].不确定数据流多维建模方法[J]. 国防科技大学学报 2014(05)
    • [9].基于粗糙模糊集的不确定数据流聚类算法[J]. 计算机科学与探索 2014(12)
    • [10].基于概率分布相似性的不确定数据聚类算法研究[J]. 高考 2016(36)
    • [11].障碍空间中基于网格的不确定数据聚类算法[J]. 计算机科学与探索 2019(03)
    • [12].高维不确定数据的子空间聚类算法[J]. 计算机应用 2019(11)
    • [13].不确定数据的有效查询处理评估技术研究[J]. 铜陵职业技术学院学报 2018(03)
    • [14].基于非参数估计与随机模拟的不确定数据流相似性度量方法[J]. 山东农业大学学报(自然科学版) 2017(04)
    • [15].基于自适应快速决策树的不确定数据流概念漂移分类算法[J]. 控制与决策 2016(09)
    • [16].一种存在级不确定数据流聚类算法[J]. 计算机应用与软件 2015(04)
    • [17].一种基于高斯混合模型的不确定数据流聚类方法[J]. 计算机研究与发展 2014(S2)
    • [18].不确定数据流自适应并行连接算法及应用[J]. 电信科学 2012(02)
    • [19].基于频繁密度分布模式的不确定数据流查询方法[J]. 哈尔滨工程大学学报 2018(06)
    • [20].一种面向不确定数据流的聚类算法[J]. 东北大学学报(自然科学版) 2016(12)
    • [21].一种面向多属性不确定数据流的模体发现算法[J]. 电子与信息学报 2017(01)
    • [22].基于小波分析的不确定数据流异常数据检测[J]. 软件导刊 2011(11)
    • [23].障碍空间中基于密度的不确定数据聚类算法[J]. 小型微型计算机系统 2017(12)
    • [24].元组级不确定数据库的概率频繁项集挖掘[J]. 南阳理工学院学报 2018(04)
    • [25].一种面向不确定数据流的模体发现算法[J]. 电子科技大学学报 2017(01)
    • [26].基于免疫原理的不确定数据流聚类算法[J]. 模式识别与人工智能 2012(05)
    • [27].时间序列不确定数据流中异常数据检测方法[J]. 电子设计工程 2011(19)
    • [28].基于优化策略的不确定数据流预测方法[J]. 计算机工程 2011(21)
    • [29].一种不确定数据流聚类算法[J]. 软件学报 2010(09)
    • [30].不确定数据流上的离群点检测处理[J]. 湖南大学学报(自然科学版) 2020(02)

    标签:;  ;  ;  ;  

    基于密度的不确定数据流聚类算法的研究与实现
    下载Doc文档

    猜你喜欢