![蚁群算法及其在聚类分析中的应用研究](https://www.lw50.cn/thumb/c189c697fb664d0a6075d213.webp)
论文摘要
当前,网络和数据库技术的快速发展,使得计算机能存储大规模的海量数据;但传统的数据分析处理工具如管理信息系统对这些数据只能进行表层的处理,更深层次的数据分析能力却不尽如人意。由此,数据挖掘技术应运而生。聚类分析作为数据挖掘中的一个重要课题,是将数据区分为自然的群体并给出每个群体特征描述。通过先进算法的恰当采用,可发掘潜在的有价值的信息,提高数据分析和解释的质量,也为后续其它数据分析和整理工具对数据的再处理或理解提供科学的判断依据。因此,研究如何提高聚类分析算法的性能具有重要意义。聚类分析的算法很多,比较著名的有K-均值算法、K-中心点算法、C均值算法、FCM算法等。蚁群算法是最近几年提出的一种新的生态类优化算法,其主要特点是正反馈、分布式计算。本文根据蚁群优化算法的最新研究,对其进行了改进,主要包含以下几方面的内容:由自然蚂蚁的智能特点,引出人工蚂蚁模型。选择最典型的旅行商问题来研究蚂蚁系统的原理,实现步骤,以及算法的时间和空间复杂度。然后研究蚁群优化算法的具体实现,算法的收敛性和特点,以及算法中参数的设置等。由蚁群算法的不足提出了当前的几种改进算法,最后介绍了蚁群算法的发展和应用。由数据挖掘的概念,引出作为数据挖掘技术的重要组成部分之一的聚类分析。重点阐述了聚类分析,主要就聚类分析的定义,聚类分析的步骤,常用的数据类型和度量标准进行了简要的归纳和总结,同时简要介绍了目前比较常用的聚类分析算法,聚类分析的历史和现状,以及聚类分析的应用。基于改进蚁群算法的聚类组合方法。分析了基本蚁群聚类模型,LF算法和基于信息熵的蚁群聚类(EAC)算法,并研究了LF和EAC算法的具体实现。同时,在比较其性能的基础上,主要针对基于信息熵的蚁群聚类算法收敛速度快,但却容易陷入局部最优的缺陷,从聚类拆分、合并、孤立点处理等几个方面作了改进,从而在利用其收敛速度快的基础上提高聚类的准确性。仿真实验表明:改进后的方法在聚类的准确性和收敛速度方面都得到了很好的结果,对基于信息熵的蚁群聚类算法提供了较好的应用改进。此外,还分析了改进的单蚁群聚类算法(SACA),提出利用速度类型各异的单蚁群以SACA并行聚类,然后将产生的结果用超图模型组合成超图,最后利用基于蚁群算法的图划分算法对超图进行划分的多蚁群聚类组合方法:MACCA。
论文目录
摘要ABSTRACT第一章 绪论1.1 引言1.2 问题的提出1.3 论文结构第二章 蚁群优化算法的基本原理及分析2.1 自然蚂蚁的智能特点2.2 人工蚂蚁的模型2.3 蚂蚁系统2.3.1 旅行商问题2.3.2 蚂蚁系统2.3.3 蚂蚁系统的实现步骤2.3.4 算法复杂度分析2.4 蚁群优化算法2.4.1 蚁群优化算法的实现2.4.2 蚁群优化算法的收敛性2.4.3 基本蚁群算法的特点2.5 蚁群优化算法中参数的设置2.6 几种改进的算法2.6.1 Ant-Q2.6.2 Max-Min Ant System2.6.3 Ant Colony System2.6.4 基于信息熵的自适应蚁群算法2.6.5 蚁群算法与其它仿生优化算法的融合2.6.6 混合蚁群算法2.6.7 具有随机扰动特征的蚁群算法2.6.8 具有感觉和知觉特征的蚁群算法2.7 蚁群算法的发展2.8 蚁群算法的应用2.9 本章 小结第三章 数据挖掘技术中的聚类分析3.1 数据挖掘概述3.2 聚类分析概念3.3 聚类分析的步骤3.4 聚类分析中的数据类型3.5 聚类分析中的相似度度量方法3.6 聚类分析算法3.6.1 K-means 算法3.6.2 BIRCH 算法3.6.3 DBSCAN 算法3.6.4 CLIQUE 算法3.6.5 SOM 算法3.6.6 FCM 算法3.7 聚类分析研究的历史和现状3.8 聚类分析的应用3.9 本章 小结第四章 基于改进蚁群算法的聚类组合方法4.1 基于信息熵的蚁群聚类方法4.1.1 基本蚁群聚类模型4.1.2 LF 算法4.1.3 LF 算法的具体实现4.1.4 基于信息熵的蚁群聚类算法4.1.5 基于信息熵的蚁群聚类算法实现4.1.6 两种算法的比较分析4.1.7 改进的基于信息熵的蚁群聚类方法4.2 改进的单蚁群聚类算法(SACA)4.2.1 平均相似性4.2.2 概率转换函数4.2.3 改进的SACA 算法描述4.3 多蚁群聚类组合算法(MACCA)4.3.1 系统结构图4.3.2 聚类组合4.3.3 基于蚁群算法的图划分算法4.4 本章 小结第五章 全文总结5.1 主要结论5.2 研究展望参考文献攻读硕士学位期间已发表或录用的论文致谢
相关论文文献
标签:数据挖掘论文; 聚类分析论文; 蚁群算法论文; 信息熵论文;