基于蚁群算法的聚类算法研究

基于蚁群算法的聚类算法研究

论文摘要

通过对蚂蚁觅食过程中总能找到一条从蚁巢到食物源的最短路径现象的数学建模,得到一种新的算法—蚁群算法。该算法采用正反馈并行自催化机制,具有较强的鲁棒性、优良的分布式计算机制、易于与其它算法融合的优点,对于解决大规模复杂问题表现出了优异的性能和巨大的发展潜力。计算机的广泛使用,越来越多的数据被产生。如何从中找出有用的、完整的、能够为未来决策其作用的知识是一个巨大的挑战。聚类分析总为数据挖掘的重要研究领域之一,具有极其重要的作用和地位。它能根据数据的属性对其进行分组和归类。聚类分析使得同一类中的数据具有最大相似性,不同类中的元素具有最大向异性。本文首先对聚类分析进行了详细总结和介绍,分析和总结了目前流行聚类算法的优缺点;同时介绍了聚类分析中的数据表示、相似性度量准则等内容。随后,对蚁群算法进行了详细的介绍,分析和总结了目前应用于聚类分析中的两种模型:基于蚁堆原理和基于蚂蚁觅食行为原理。本文的重点是提出了一种新的蚁群聚类算法,它利用R只蚂蚁来求解,每只蚂蚁在开始的时候均分配一个空的串S ,该串的大小为N。串S中的数值表示相应的元素被分配到的具体的哪个类。将类中心和元素分别看作是食物源和蚁巢,蚂蚁根据信息素矩阵的值进行类标识分配。为了避免陷入局部最优,一次迭代之后,采用局部搜索技术来试图跳出局部最优。反复重复上述步骤,最终得到预期的解。为了验证本文算法的有效性和优越性,文中引入遗传算法、模拟退火算法和禁忌搜索算法来进行比较实验,实验中采用两个模拟数据集和三个UCI中的数据集。实验结果表明,本文提出的蚁群聚类算法要优于其它三种随机算法。随着Web站点自身信息越来越丰富和结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况,不同的用户有不同的访问目的。因此,将蚁群聚类算法应用于Web日志挖掘,实现网站的自适应,既把从日志数据中提取的知识转换为站点的只能,使其为用户提供更有效的服务。为此,本文设计并实现了一个自适应网站的原型系统,从而验证了运用相关技术实现网站自适应是可行的。本文最后对所有工作进行了总结,并对未来工作进行了展望。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景及意义
  • 1.2 研究现状
  • 1.2.1 聚类算法研究现状
  • 1.2.2 蚁群算法研究现状
  • 1.2.3 蚁群聚类算法的研究现状
  • 1.3 本文研究目标及主要研究内容
  • 1.4 章节安排
  • 第二章 蚁群聚类算法理论基础
  • 2.1 数据挖掘基本原理
  • 2.1.1 数据挖掘的一般过程
  • 2.1.2 数据挖掘的一般功能
  • 2.1.3 数据挖掘的一般方法
  • 2.1.4 数据挖掘的发展
  • 2.2 聚类分析理论基础
  • 2.2.1 聚类分析在数据挖掘中的应用
  • 2.2.2 聚类分析算法的概念与基本分类
  • 2.2.3 距离与相似性的度量
  • 2.2.4 划分聚类方法
  • 2.2.5 k-平均算法分析
  • 2.2.6 PAM 算法分析
  • 2.2.7 改进的划分聚类算法分析
  • 2.2.8 层次聚类方法
  • 2.2.9 密度聚类方法分析
  • 2.2.10 其他聚类方法分析
  • 2.2.11 聚类算法的比较
  • 2.3 蚁群算法相关理论
  • 2.3.1 蚁群算法基本原理
  • 2.3.2 基本蚁群算法的数学模型
  • 2.3.3 基本蚁群算法的实现
  • 2.3.4 基本蚁群算法的优缺点
  • 2.4 蚁群聚类算法
  • 2.4.1 基于蚁堆原理的蚁群聚类算法
  • 2.4.2 基于信息熵的蚁群聚类算法
  • 2.5 本章小结
  • 第三章 蚁群聚类算法
  • 3.1 智能算法在聚类分析中的应用
  • 3.1.1 神经网络在聚类分析中的应用
  • 3.1.2 遗传算法在聚类分析中的应用
  • 3.2 蚁群聚类算法研究
  • 3.2.1 算法具体描述
  • 3.3 本章小结
  • 第四章 仿真实验与结果分析
  • 4.1 实验设计
  • 4.2 实验结果分析
  • 4.3 本章小结
  • 第五章 WEB 日志挖掘的自适应站点原型系统
  • 5.1 设计思想
  • 5.2 体系结构
  • 5.3 离线处理部分
  • 5.4 在线推荐部分
  • 5.5 系统实现
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 附录:蚁群聚类的JAVA 实现
  • 相关论文文献

    • [1].算法:一种新的权力形态[J]. 治理现代化研究 2020(01)
    • [2].算法决策规制——以算法“解释权”为中心[J]. 现代法学 2020(01)
    • [3].面向宏观基本图的多模式交通路网分区算法[J]. 工业工程 2020(01)
    • [4].算法中的道德物化及问题反思[J]. 大连理工大学学报(社会科学版) 2020(01)
    • [5].算法解释请求权及其权利范畴研究[J]. 甘肃政法学院学报 2020(01)
    • [6].算法新闻的公共性建构研究——基于行动者网络理论的视角[J]. 人民论坛·学术前沿 2020(01)
    • [7].算法的法律性质:言论、商业秘密还是正当程序?[J]. 比较法研究 2020(02)
    • [8].关键词批评视野中的算法文化及其阈限性[J]. 学习与实践 2020(02)
    • [9].掌控还是被掌控——大数据时代有关算法分发的忧患与反思[J]. 新媒体研究 2020(04)
    • [10].美国算法治理政策与实施进路[J]. 环球法律评论 2020(03)
    • [11].算法解释权:科技与法律的双重视角[J]. 苏州大学学报(哲学社会科学版) 2020(02)
    • [12].大数据算法决策的问责与对策研究[J]. 现代情报 2020(06)
    • [13].大数据时代算法歧视的风险防控和法律规制[J]. 河南牧业经济学院学报 2020(02)
    • [14].风险防范下算法的监管路径研究[J]. 审计观察 2019(01)
    • [15].模糊的算法伦理水平——基于传媒业269名算法工程师的实证研究[J]. 新闻大学 2020(05)
    • [16].算法推荐新闻对用户的影响及对策[J]. 新媒体研究 2020(10)
    • [17].如何加强对算法的治理[J]. 国家治理 2020(27)
    • [18].“后真相”背后的算法权力及其公法规制路径[J]. 行政法学研究 2020(04)
    • [19].算法规制的谱系[J]. 中国法学 2020(03)
    • [20].论算法排他权:破除算法偏见的路径选择[J]. 政治与法律 2020(08)
    • [21].政务算法与公共价值:内涵、意义与问题[J]. 国家治理 2020(32)
    • [22].算法的法律规制研究[J]. 上海商业 2020(09)
    • [23].新闻算法分发对隐私权的冲击及规制[J]. 青年记者 2020(27)
    • [24].算法如何平等:算法歧视审查机制的建立[J]. 南海法学 2020(02)
    • [25].蚁群算法在文字识别中的应用研究[J]. 信息与电脑(理论版) 2019(22)
    • [26].大数据聚类算法研究[J]. 无线互联科技 2018(04)
    • [27].RSA算法的改进研究[J]. 计算机与网络 2018(14)
    • [28].智能时代的新内容革命[J]. 国际新闻界 2018(06)
    • [29].改进的负载均衡RSA算法[J]. 电脑知识与技术 2018(25)
    • [30].基于深度学习的视觉跟踪算法研究综述[J]. 计算机科学 2017(S1)

    标签:;  ;  ;  ;  

    基于蚁群算法的聚类算法研究
    下载Doc文档

    猜你喜欢