扩散距离下的Kernel K-means聚类算法的改进

扩散距离下的Kernel K-means聚类算法的改进

论文摘要

K-means算法是聚类(Clustering)问题的经典算法,Kernel K-means算法为其改进算法,用核(Kernel)的作用代替了距离(Distance)的作用,从而从维度上改变了数据的的结构,造成数据的非线性分割,这在非线性数据的情况下往往比K-means算法分类效果好。数据上的扩散映射(Diffusion Map),可以直接导出数据之间距离的定义,称为扩散距离(Diffusion Distance)。但是由于扩散距离本身的计算存在一定的复杂度,所以些算法在时间复杂度方面并不一定存在优势。本文的研究主要分为两部分:一是如何将扩散距离应用到Kernel K-means算法中,并且旨在不过多增加算法复杂度的前提下,得到更为理想的分类结果;二是如何在数据核变换的过程中,利用数据的实验结果,学习得到扩散系数等参数,从而构造出最终的算法.

论文目录

  • 摘要
  • Abstract
  • 第1章 背景
  • 1.1 聚类算法分类
  • 1.1.1 自动化聚类
  • 1.1.2 半自动化聚类
  • 1.2 聚类算法的一般步骤
  • 1.2.1 特征提取
  • 1.2.2 聚类算法
  • 1.2.3 聚类的有效性
  • 1.2.4 给出结论
  • 1.3 本文的工作计划
  • 第2章 理论部分
  • 2.1 聚类算法
  • 2.1.1 距离与相似度
  • 2.1.2 K-means 算法
  • 2.1.3 Kernel K-means 算法
  • 2.1.4 层次聚类
  • 2.2 扩散距离
  • 2.2.1 数据集上的 Markov 链
  • 2.2.2 扩散距离和扩散映射
  • 第3章 算法实现
  • 3.1 算法的构造
  • 3.1.1 Kernel K-means 算法构造
  • 3.1.2 扩散距离的引入
  • 3.1.3 线性数据
  • 3.2 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于Kernel K-means的负荷曲线聚类[J]. 电力自动化设备 2016(06)
    • [2].基于kernel K-means算法的城市交通客流量分析[J]. 物流技术 2013(17)
    • [3].磴口县地下水埋深时空变化特征[J]. 南水北调与水利科技 2017(03)

    标签:;  ;  ;  ;  

    扩散距离下的Kernel K-means聚类算法的改进
    下载Doc文档

    猜你喜欢