基于多智能体的数据流聚类算法研究

基于多智能体的数据流聚类算法研究

论文摘要

随着现实生活中人们要处理的数据量急剧增长,海量的数据以数据流形式广泛存在于各个领域中并伴随有数据按时间顺序到达、数据分布快速变化、数据量潜在无限的特点。许多学者通过扩展针对静态数据的经典聚类算法而提出针对数据流的聚类算法,这些算法大多采用集中式的策略,需要获取一些先验知识(如类簇数目等)才能完成聚类,然而用户无法预知数据分布从而无法给出与实际相符的先验知识,因而该类算法无法获得良好的聚类效果。本文利用群智能的分布性、鲁棒性和可扩展性等优点采用多智能体来解决数据流聚类问题,首先对基于多智能体的聚类算法(FClust)进行改进而提出针对静态数据的多智能体聚类算法(AIFClust),该算法中具有和鸟群个体相同行为规则的智能体(agent)与邻居智能体相互影响,通过智能体自身的运动作用于生存环境--可视化面板,最终智能体代表的数据聚集成簇,且整个聚类过程为一个可视化过程加强了算法的用户体验。通过改进后算法与原算法的对比实验表明:改进智能体之间作用力的IFClust算法提高了算法的聚类质量并增强了算法发现类簇的能力,增加对智能体向心力作用的AFClust算法加快了算法的收敛速度而且增强了算法的稳定性,综合两种改进方案的AIFClust算法则同时继承了这两种算法的优势表现出了比FClust算法更优的聚类性能。通过对AIFClust算法与蚁群聚类算法及经典K-means算法的对比实验表明:AIFClust算法发现类簇数目的能力比蚁群聚类算法更强且聚类结果的准确率与K-means算法相当。鉴于AIFClust算法在静态数据聚类问题中表现出的良好性能,本文对AIFClust算法进行扩展运用于存在级不确定性数据流的聚类问题上而提出基于多智能体的数据流聚类算法(FClustStream)。该算法采纳数据流聚类算法中经典的二层聚类模型,将聚类过程分为在线-离线两个阶段:算法在线阶段维护核心agent缓冲区和潜在agent缓冲区,缓冲区内存储的智能体通过概率引力作用来吸收流入的数据点并通过不确定聚类特征来概括数据信息以此形成微簇,同时算法实时更新这两个缓冲区,将过期的智能体删除并保证具有较大权值的智能体储存在核心agent缓冲区中;算法离线阶段则对核心agent缓冲区的智能体进行AIFClust聚类。通过对FClustStream算法和EMicro算法的对比实验表明,采用分布式群智能聚类方案的FClustStream算法比采用集中处理方式的EMicro算法具有更快的处理速度,在未知类簇数目的情况下能获得更紧凑的聚簇和更合理的聚类结果,且算法具备可扩展性。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文的主要工作
  • 1.4 本文的结构安排
  • 第二章 聚类分析概述
  • 2.1 聚类分析
  • 2.1.1 数据预处理
  • 2.1.2 数据的相似性度量
  • 2.1.3 经典聚类算法
  • 2.1.4 数据流聚类要求及相关技术
  • 2.2 群智能聚类算法
  • 2.2.1 蚁群聚类算法和粒子群聚类算法
  • 2.2.2 FClust算法及其变种
  • 2.3 数据流聚类算法
  • 2.3.1 确定性数据流聚类算法
  • 2.3.2 不确定性数据流聚类算法
  • 2.4 本章小结
  • 第三章 基于多智能体的聚类算法
  • 3.1 FClust算法
  • 3.1.1 相关定义
  • 3.1.2 算法流程
  • 3.2 FClust算法的不足及改进
  • 3.2.1 邻居影响力的改进(Influence-improved FClust,IFClust)
  • 3.2.2 增加向心力作用(Attraction-added FClust,AFClust)
  • 3.3 改进后的AIFC1ust算法
  • 3.3.1 AIFClust算法流程
  • 3.3.2 迭代终止条件
  • 3.3.3 类标标记算法
  • 3.4 实验分析与比较
  • 3.4.1 实验数据
  • 3.4.2 实验参数设置
  • 3.4.3 聚类评价标准
  • 3.4.4 算法聚类性能的对比分析
  • 3.4.5 算法收敛速度分析
  • 3.4.6 与其他算法聚类准确率的比较
  • 3.5 本章小结
  • 第四章 基于多智能体的不确定数据流聚类算法
  • 4.1 相关定义
  • 4.2 FClustStream算法
  • 4.2.1 在线聚类
  • 4.2.2 离线聚类
  • 4.2.3 算法的时间复杂度分析
  • 4.3 实验分析与比较
  • 4.3.1 聚类质量
  • 4.3.2 聚类时间
  • 4.3.3 聚类效果
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 个人简历
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于多智能体的数据流聚类算法研究
    下载Doc文档

    猜你喜欢