不确定数据流聚类算法的研究与实现

不确定数据流聚类算法的研究与实现

论文摘要

传统的确定数据流管理系统及技术在近几年中得到了长足的发展并形成了成熟的研究领域。然而,随着信息产业各领域的不断发展和近似测量数据的硬件被大量应用,使得对不确定数据的研究形成了相应的领域并取得了相应的成果。在实际应用中,由于测量的不准确性,数据传输中引入的噪音以及数据源本身具有的不确定性,使得流数据的不确定性广泛存在并成为流数据的一个固有性质。因此对不确定性数据流的管理技术及其处理技术越来越被关注和重视。随着数据挖掘技术的广泛运用,近年来对不确定数据的挖掘做了大量的工作及相关研究。数据挖掘中的一个重要研究课题是聚类,对不确定数据流聚类算法的研究有重要的意义。在聚类过程中,描述对象间的相似程度以及簇间的相异程度通常是用距离来衡量的,因此描述不确定对象间的距离对于不确定对象的聚类算法的研究起着至关重要的作用。本文通过分析给出了计算不确定对象间距离的改进方法:摘要估计方法(ASM),该方法在计算不确定对象间距离时考虑了不确定对象的分布情况,将偏差纳入了计算过程,进而提高计算结果的准确度。然后提出了计算不确定对象与集合间距离的改进方法:平均组合距离(MPD)。与传统方法不同的是,MPD方法考虑了簇内所有元素对结果的影响,并将不确定对象与簇内所有元素距离的平均值作为不确定对象与集合间的距离。之后,提出了聚类过程中描述簇统计信息的向量:簇信息向量,该向量记录簇内所有元素的平方和等相关信息。最后,提出了一种不确定数据流聚类算法UKluStream,并通过实验验证了算法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.1.1 不确定数据的产生原因
  • 1.1.2 不确定数据应用
  • 1.2 国内外研究现状
  • 1.2.1 不确定数据模型
  • 1.2.2 不确定数据查询技术
  • 1.3 不确定性数据管理面临的挑战
  • 1.4 论文的组织结构
  • 第2章 不确定性数据流聚类相关技术研究
  • 2.1 数据挖掘概述
  • 2.1.1 数据挖掘的功能
  • 2.1.2 数据挖掘的应用
  • 2.2 传统数据聚类算法
  • 2.2.1 聚类方法
  • 2.2.2 聚类分析概述
  • 2.3 数据流聚类
  • 2.3.1 流数据及其聚类特征
  • 2.3.2 流数据概要描述技术
  • 2.3.3 数据流聚类相关算法
  • 2.4 不确定数据流的聚类
  • 2.5 聚类算法的要求
  • 2.6 本章小结
  • 第3章 不确定数据距离处理技术
  • 3.1 距离的相关概念及定义
  • 3.1.1 对象的描述
  • 3.1.2 距离度量
  • 3.1.3 不确定域
  • 3.2 确定对象距离计算
  • 3.3 不确定对象距离的计算
  • 3.3.1 点与点的距离
  • 3.3.2 点与集合的距离
  • 3.3.3 集合到集合的距离
  • 3.4 本章小结
  • 第4章 不确定数据流的聚类算法
  • 4.1 相关概念及定义
  • 4.1.1 滑动窗口概念
  • 4.1.2 基于紧凑度的相关定义
  • 4.2 算法描述
  • 4.2.1 点加入簇
  • 4.2.2 簇的合并
  • 4.2.3 簇的拆分
  • 4.2.4 簇的删除
  • 4.3 算法实现
  • 4.3.1 初始化算法
  • 4.3.2 执行部分算法
  • 4.4 本章小结
  • 第5章 实验结果分析
  • 5.1 测试环境及测试数据集
  • 5.1.1 实验环境
  • 5.1.2 测试数据集
  • 5.2 实验结果及对比
  • 5.2.1 算法评价标准
  • 5.2.2 初始化算法
  • 5.2.3 执行过程测试
  • 5.3 本章小结
  • 第6章 结论与展望
  • 参考文献
  • 致谢
  • 攻读硕士期间发表的论文及参加的项目
  • 相关论文文献

    • [1].一种联系数表达的位置不确定数据流聚类算法[J]. 小型微型计算机系统 2020(02)
    • [2].基于概率分布的不确定数据聚类[J]. 深圳信息职业技术学院学报 2018(05)
    • [3].基于密度的不确定数据流聚类算法[J]. 清华大学学报(自然科学版) 2017(08)
    • [4].基于近邻传播的不确定数据流演化聚类算法[J]. 模式识别与人工智能 2016(05)
    • [5].隐含概念漂移的不确定数据流集成分类算法[J]. 计算机工程与科学 2016(07)
    • [6].一种基于预裁剪的不确定数据流频繁项集挖掘算法[J]. 科学技术与工程 2016(23)
    • [7].大数据环境下的不确定数据流在线分类算法[J]. 东北大学学报(自然科学版) 2016(09)
    • [8].不确定数据流多维建模方法[J]. 国防科技大学学报 2014(05)
    • [9].基于粗糙模糊集的不确定数据流聚类算法[J]. 计算机科学与探索 2014(12)
    • [10].基于概率分布相似性的不确定数据聚类算法研究[J]. 高考 2016(36)
    • [11].障碍空间中基于网格的不确定数据聚类算法[J]. 计算机科学与探索 2019(03)
    • [12].高维不确定数据的子空间聚类算法[J]. 计算机应用 2019(11)
    • [13].不确定数据的有效查询处理评估技术研究[J]. 铜陵职业技术学院学报 2018(03)
    • [14].基于非参数估计与随机模拟的不确定数据流相似性度量方法[J]. 山东农业大学学报(自然科学版) 2017(04)
    • [15].基于自适应快速决策树的不确定数据流概念漂移分类算法[J]. 控制与决策 2016(09)
    • [16].一种存在级不确定数据流聚类算法[J]. 计算机应用与软件 2015(04)
    • [17].一种基于高斯混合模型的不确定数据流聚类方法[J]. 计算机研究与发展 2014(S2)
    • [18].不确定数据流自适应并行连接算法及应用[J]. 电信科学 2012(02)
    • [19].基于频繁密度分布模式的不确定数据流查询方法[J]. 哈尔滨工程大学学报 2018(06)
    • [20].一种面向不确定数据流的聚类算法[J]. 东北大学学报(自然科学版) 2016(12)
    • [21].一种面向多属性不确定数据流的模体发现算法[J]. 电子与信息学报 2017(01)
    • [22].基于小波分析的不确定数据流异常数据检测[J]. 软件导刊 2011(11)
    • [23].障碍空间中基于密度的不确定数据聚类算法[J]. 小型微型计算机系统 2017(12)
    • [24].元组级不确定数据库的概率频繁项集挖掘[J]. 南阳理工学院学报 2018(04)
    • [25].一种面向不确定数据流的模体发现算法[J]. 电子科技大学学报 2017(01)
    • [26].基于免疫原理的不确定数据流聚类算法[J]. 模式识别与人工智能 2012(05)
    • [27].时间序列不确定数据流中异常数据检测方法[J]. 电子设计工程 2011(19)
    • [28].基于优化策略的不确定数据流预测方法[J]. 计算机工程 2011(21)
    • [29].一种不确定数据流聚类算法[J]. 软件学报 2010(09)
    • [30].不确定数据流上的离群点检测处理[J]. 湖南大学学报(自然科学版) 2020(02)

    标签:;  ;  ;  ;  

    不确定数据流聚类算法的研究与实现
    下载Doc文档

    猜你喜欢