基于PSO算法的离群点检测方法研究

基于PSO算法的离群点检测方法研究

论文摘要

聚类、分类和关联规则分析等数据挖掘技术实现从海量数据中抽取出共同特征和一般模式,为科学决策提供有用信息。离群点检测恰恰相反,关注的是数据集中明显偏离其他数据对象、与数据集一般特征相背离的少部分对象。这样一些潜在的离群对象可能蕴含了重要的领域知识,如信用卡欺诈、网络入侵和异常疾病等现象。因此,对离群点检测技术进行研究具有重要的现实意义。传统的离群点检测方法存在参数设置困难、计算开销大或相似度概念失效等问题。为了克服这些问题,近期一些学者尝试将粒子群算法应用于离群点检测,取得了良好的效果,但依然存在一些缺陷。本文对如何有效地应用粒子群算法进行离群点检测进行较为深入地探讨。基于目标函数最小化的思想,分别通过保护粒子多样性来避免算法的早熟收敛和更合理定义适应值函数这两个角度出发,提出两种新的基于PSO思想的群体智能搜索算法并应用于离群点检测,改进了现有的一些研究成果。本文的主要研究包括:1、为减缓粒子多样性随迭代深入而逐渐降低的速度,提出一种对聚集粒子进行动态扩散的改进方法(CPD-PSO)。算法结合变异机制,通过控制惯性系数和收敛因子来使粒子以较强的全局探索能力跳出局部极值点,对粒子的扩散受迭代次数和粒子聚集程度的影响。仿真实验结果表明,基于聚集粒子扩散的粒子群算法优于标准粒子群算法和其他一些改进算法。2、在离群点检测问题中,粒子编码为对象编号和邻域半径。为将CPD-PSO算法应用于检测离群点,需对算法进行调整:将粒子相似度定义为这两个维度上的绝对差异之和,使算法仅对编号相同而邻域半径存在略微差异的部分粒子进行扩散。对若干UCI数据集的实验结果表明CPD-PSO算法较标准粒子群算法具有更好的检测效果。3、Mohemmed等人新近提出将离群点检测转化为目标函数最小化问题的离群检测方法,并利用粒子群优化算法进行求解。通过对Yeast数据集的实验跟踪发现,该方法可能出现粒子适应值和相应对象离群度不匹配的不合理现象,本文分析了产生该现象的原因,提出一种新的适应值函数,并给出理论分析和实验对比的结果。实验表明,采用新适应值函数的检测算法优于原方法及LOF、LDOF和KNN等检测方法。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 离群点检测
  • 1.1.2 粒子群算法
  • 1.2 研究内容和创新点
  • 1.3 论文的组织结构
  • 第二章 离群点检测问题及若干典型算法
  • 2.1 离群点检测的概念和意义
  • 2.2 几种典型的离群点检测算法
  • 2.2.1 基于统计分析的方法
  • 2.2.2 基于距离的方法
  • 2.2.3 基于密度的方法
  • 2.2.4 基于深度的方法
  • 2.3 离群点挖掘技术的研究热点
  • 2.4 本章小结
  • 第三章 粒子群算法基本思想
  • 3.1 粒子群算法基础
  • 3.2 粒子群算法工作流程
  • 3.3 粒子群算法的改进
  • 3.3.1 带惯性权重的PSO算法
  • 3.3.2 带收敛因子的PSO算法
  • 3.3.3 结合其他进化思想的PSO算法
  • 3.3.4 基于种群多样性的PSO算法
  • 3.4 本章小结
  • 第四章 基于聚集粒子分散化的改进PSO算法
  • 4.1 引言
  • 4.2 CPD-PSO算法
  • 4.2.1 基于距离概念的粒子相似原则
  • 4.2.2 聚集微簇
  • 4.2.3 聚集微簇的扩散
  • 4.3 参与比较的几种典型的改进PSO算法
  • 4.3.1 基于耗散机制的算法DPSO算法
  • 4.3.2 协同粒子群优化算法CPSO
  • 4.3.3 综合学习粒子群优化算法CLPSO
  • 4.3.4 智能单粒子优化算法ISPO
  • 4.4 基准测试函数
  • 4.5 实验结果与分析
  • 4.6 本章小结
  • 第五章 改进的PSO算法在离群点检测中的应用
  • 5.1 引言
  • 5.2 基于PSO的离群点检测
  • 5.3 存在的问题
  • 5.4 一种新的适应值函数及算法
  • 5.4.1 新的适应值函数定义
  • *算法流程'>5.4.2 outPSO*算法流程
  • 5.4.3 实验结果与分析
  • 5.5 CPD-PSO算法在离群点检测中的应用
  • 5.5.1 算法调整
  • 5.5.2 实验结果与分析
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 本文工作总结
  • 6.2 研究展望
  • 参考文献
  • 致谢
  • 个人简历
  • 在学期间研究成果及发表的学术论文
  • 相关论文文献

    • [1].基于集成方法的离群点检测算法研究[J]. 电子世界 2020(06)
    • [2].基于局部估计密度的局部离群点检测算法[J]. 小型微型计算机系统 2020(02)
    • [3].基于插值的高维稀疏数据离群点检测方法[J]. 计算机工程与科学 2020(06)
    • [4].离群点检测算法的评价指标[J]. 计算机应用 2020(09)
    • [5].离群点识别方法研究[J]. 软件导刊 2019(06)
    • [6].基于离群点检测和分类的软测量方法[J]. 山东化工 2018(09)
    • [7].基于地统计学的空间离群点检测算法的研究[J]. 计算机应用研究 2016(12)
    • [8].基于高频关键词的离群点监测与异类知识研究——从文献分析视角[J]. 情报杂志 2017(05)
    • [9].离群点检测概述[J]. 信息系统工程 2017(05)
    • [10].一种分布式计算的空间离群点挖掘算法[J]. 测绘科学 2017(08)
    • [11].一种基于多标记的局部离群点检测算法[J]. 微电子学与计算机 2017(10)
    • [12].基于改进的离群点检测软测量方法研究[J]. 自动化与信息工程 2015(04)
    • [13].基于集合论估计的电网状态辨识 (四)离群点识别[J]. 电力系统自动化 2016(08)
    • [14].异质网中基于张量表示的动态离群点检测方法[J]. 计算机研究与发展 2016(08)
    • [15].一种基于多示例学习的局部离群点检测算法[J]. 信息与控制 2016(04)
    • [16].集成电路中用于离群点测试选择的总体框架[J]. 工业控制计算机 2014(11)
    • [17].关联子空间离群点挖掘[J]. 小型微型计算机系统 2015(05)
    • [18].基于距离的数据流离群点快速检测[J]. 世界科技研究与发展 2013(04)
    • [19].离群点检测算法在药品不良反应异常信号挖掘中的应用[J]. 现代养生 2017(06)
    • [20].从数学的角度初步看离群点检测算法[J]. 环球市场信息导报 2017(36)
    • [21].一种个性化k近邻的离群点检测算法[J]. 小型微型计算机系统 2020(04)
    • [22].一种面向混合属性数据的邻域粒离群点检测[J]. 小型微型计算机系统 2020(04)
    • [23].基于多相关性的传感数据离群点检测与处理[J]. 测控技术 2020(04)
    • [24].基于主动学习的离群点集成挖掘方法研究[J]. 计算机工程与应用 2020(12)
    • [25].聚类剪枝算法在离群点检测中的应用[J]. 广东通信技术 2018(12)
    • [26].基于多示例学习的局部离群点改进算法[J]. 计算机工程与应用 2019(18)
    • [27].一种改进隔离森林的快速离群点检测算法[J]. 小型微型计算机系统 2019(11)
    • [28].一种基于密度的离群点检测方法[J]. 西南科技大学学报 2018(01)
    • [29].离群点检测技术在教育教学中的应用[J]. 现代教育技术 2018(06)
    • [30].基于图像的重建点云离群点检测算法[J]. 数据采集与处理 2018(05)

    标签:;  ;  ;  ;  ;  

    基于PSO算法的离群点检测方法研究
    下载Doc文档

    猜你喜欢