基于模糊聚类的非监督学习研究

基于模糊聚类的非监督学习研究

论文摘要

学习是人类智能的主要标志和获得智慧的基本手段,是人类具有的一种重要智能行为。在机器学习中,学习性能的好坏是衡量一个学习系统优劣最重要的指标。作为非监督学习方法的模糊聚类分析已成为机器学习研究的热点,为提高和改善机器学习性能提供了良好的理念支持与技术手段。研究模糊聚类算法对于提高和改善机器的学习性能具有重大的理论和现实意义。在模糊聚类算法中,由于模糊C-均值聚类算法(Fuzzy C-mean Clustering Algorithm,FCM)计算简单,具有比较直观的几何意义,在许多领域获得了非常成功的应用。然而基于传统目标函数的FCM,采用迭代的爬山技术来寻找最优解,本质上是一种局部搜索算法。因而其存在着两大致命的问题:一是处理大数据量费时,二是对数据初始化敏感,容易陷入局部极小值。对此,本论文运用实验和比较方法,着重从以下几个方面对FCM加以改进:1、在提高FCM算法对大数据量的聚类速度方面,通过多次随机取样聚类与数据约减相结合,以减少FCM算法收敛所需的迭代次数与运算时间;为了提高FCM算法的聚类正确率,对模式分类作出不同贡献的各维特征进行加权选择,使得聚类结果更好。2、由于FCM会陷入局部最优化,论文采用遗传算法加以解决。将遗传算法与FCM结合产生基于遗传算法的模糊C-均值聚类算法GFCM,充分发挥FCM的局部搜索和遗传算法的全局搜索能力,提高算法聚类正确率。3、针对FCM对大数据量处理速度慢的缺点,运用神经网络技术改进模糊聚类算法。将自组织映射神经网络(Self-Organizing feature Map,SOM)与FCM结合,产生基于SOM的模糊C-均值聚类算法FKCN,利用SOM的并行计算,以提高聚类算法的速度和效果,实验结果表明算法有效。通过对FCM算法的上述改进,以弥补其局限性,使得算法更具合理,从而减少聚类时间,提高聚类效果,以此提升非监督学习能力、效率与稳定性,优化机器学习性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 问题提出
  • 1.2 研究现状
  • 1.3 研究内容
  • 1.4 研究方法
  • 1.5 论文结构
  • 第二章 非监督学习与模糊聚类分析
  • 2.1 非监督学习
  • 2.1.1 非监督学习概念
  • 2.1.2 非监督学习的作用
  • 2.1.3 非监督学习方法分类
  • 2.2 聚类分析
  • 2.2.1 聚类分析的基本概念
  • 2.2.2 聚类分析的作用
  • 2.2.3 聚类算法的分类
  • 2.2.4 聚类算法的一般步骤
  • 2.2.5 聚类分析的研究方向
  • 2.3 模糊理论
  • 2.3.1 模糊数学概述
  • 2.3.2 模糊集合
  • 2.3.3 模糊关系
  • 2.4 模糊聚类分析
  • 2.4.1 模糊聚类的一般模型
  • 2.4.2 模糊聚类的研究现状
  • 第三章 模糊C-均值聚类算法及其改进
  • 3.1 基于目标函数的模糊聚类分析
  • 3.1.1 数据集的C划分
  • 3.1.2 聚类目标函数
  • 3.2 硬C-均值聚类算法
  • 3.3 模糊C-均值聚类算法
  • 3.3.1 FCM概述
  • 3.3.2 FCM算法实现步骤
  • 3.3.3 FCM算法的优缺点
  • 3.4 FCM的改进
  • 3.4.1 提高聚类速度
  • 3.4.2 提高聚类正确率
  • 3.5 小结
  • 第四章 基于遗传算法的FCM
  • 4.1 遗传算法概述
  • 4.2 遗传算法流程
  • 4.3 遗传算法的设计
  • 4.4 基于遗传算法的FCM
  • 4.4.1 编码
  • 4.4.2 初始化
  • 4.4.3 适应度函数的确定
  • 4.4.4 选择算子
  • 4.4.5 交叉算子
  • 4.4.6 变异算子
  • 4.4.7 GFCM的实现过程
  • 4.4.8 实验结果与说明
  • 4.5 小结
  • 第五章 模糊自组织映射神经网络聚类算法
  • 5.1 人工神经网络基础
  • 5.1.1 人工神经网络的发展
  • 5.1.2 人工神经网络的拓扑特性
  • 5.2 自组织特征映射神经网络
  • 5.2.1 竞争学习与侧抑制
  • 5.2.2 竞争学习原理
  • 5.2.3 自组织特征映射神经网络
  • 5.3 模糊自组织神经网络聚类算法
  • 5.3.1 自组织映射神经网络聚类算法的弱点
  • 5.3.2 模糊自组织映射神经网络聚类算法
  • 5.3.3 实验及结果分析
  • 5.4 小结
  • 第六章 结束语
  • 6.1 文本的主要工作
  • 6.2 进一步的研究
  • 参考文献
  • 附录 IRIS数据集
  • 致谢
  • 相关论文文献

    • [1].非监督学习图像层次组合模型的研究算法[J]. 山西大同大学学报(自然科学版) 2015(03)
    • [2].建筑HVAC的可视化及基于非监督学习的异常探测[J]. 中国房地产 2020(27)
    • [3].基于非监督学习的恶意欠费用电客户识别[J]. 信息技术 2019(03)
    • [4].一种快速有效的遥感图像场景分类特征[J]. 哈尔滨工业大学学报 2016(05)
    • [5].聚类分析在图书馆管理中的应用研究[J]. 中国新技术新产品 2016(10)
    • [6].半监督学习在研究生调剂中的应用[J]. 计算机系统应用 2011(04)
    • [7].应用于图像特征识别的主成分分析算法[J]. 科技信息(科学教研) 2008(22)
    • [8].基于非监督学习神经网络的自动调制识别研究与实现[J]. 计算机应用与软件 2011(01)
    • [9].基于多例学习的Web图像聚类[J]. 计算机研究与发展 2009(09)
    • [10].机器学习综述[J]. 通讯世界 2018(10)
    • [11].生成对抗网络理论模型和应用综述[J]. 金华职业技术学院学报 2017(03)
    • [12].演化数据的学习[J]. 计算机学报 2013(02)
    • [13].基于卷积脉冲神经网络的图像分类算法仿真[J]. 信息技术与信息化 2020(04)
    • [14].模糊粒化非监督学习结合随机森林融合的旋转机械故障诊断[J]. 机械科学与技术 2018(11)
    • [15].雷达图像在船舶探测与特征提取中的应用研究[J]. 舰船科学技术 2016(20)
    • [16].基于非监督模型的无线网络异常检测[J]. 江苏通信 2017(06)
    • [17].独立分量分析结合马氏距离的非监督损伤识别方法[J]. 计算机应用与软件 2012(06)
    • [18].基于多示例的K-means聚类学习算法[J]. 计算机工程 2009(22)
    • [19].基于领域知识的神经网络泛化性能研究进展[J]. 武汉大学学报(工学版) 2016(03)
    • [20].一种基于数据融合的新的入侵检测框架[J]. 物联网技术 2015(08)
    • [21].基于大数据的电梯故障诊断与预测研究[J]. 机电工程 2019(01)
    • [22].改进卷积自编码器的局部特征描述算法[J]. 计算机工程与应用 2017(19)
    • [23].自组织增量学习神经网络综述[J]. 软件学报 2016(09)
    • [24].二值无线传感网络下异常活动的分布式检测[J]. 北京理工大学学报 2015(01)
    • [25].半监督学习及其在数据挖掘中的应用[J]. 电脑知识与技术 2010(27)
    • [26].稀疏分层概率自组织图实例迁移学习方法[J]. 计算机应用 2016(03)
    • [27].基于模糊聚类集成算法的客户细分研究[J]. 情报杂志 2011(04)
    • [28].面向教育技术学文献数据的主题挖掘[J]. 现代教育技术 2009(05)
    • [29].人脸图像超分辨率的自适应流形学习方法[J]. 计算机辅助设计与图形学学报 2008(07)
    • [30].供电表单类识别算法研究[J]. 中国高新科技 2020(16)

    标签:;  ;  ;  ;  

    基于模糊聚类的非监督学习研究
    下载Doc文档

    猜你喜欢