扩散距离下的Kernel K-means聚类算法的改进

论文摘要

K-means算法是聚类（Clustering）问题的经典算法，Kernel K-means算法为其改进算法,用核（Kernel）的作用代替了距离（Distance）的作用，从而从维度上改变了数据的的结构，造成数据的非线性分割，这在非线性数据的情况下往往比K-means算法分类效果好。数据上的扩散映射（Diffusion Map）,可以直接导出数据之间距离的定义，称为扩散距离（Diffusion Distance）。但是由于扩散距离本身的计算存在一定的复杂度，所以些算法在时间复杂度方面并不一定存在优势。本文的研究主要分为两部分:一是如何将扩散距离应用到Kernel K-means算法中，并且旨在不过多增加算法复杂度的前提下,得到更为理想的分类结果;二是如何在数据核变换的过程中,利用数据的实验结果,学习得到扩散系数等参数,从而构造出最终的算法.

论文目录

摘要

Abstract

第1章背景

1.1 聚类算法分类

1.1.1 自动化聚类

1.1.2 半自动化聚类

1.2 聚类算法的一般步骤

1.2.1 特征提取

1.2.2 聚类算法

1.2.3 聚类的有效性

1.2.4 给出结论

1.3 本文的工作计划

第2章理论部分

2.1 聚类算法

2.1.1 距离与相似度

2.1.2 K-means 算法

2.1.3 Kernel K-means 算法

2.1.4 层次聚类

2.2 扩散距离

2.2.1 数据集上的 Markov 链

2.2.2 扩散距离和扩散映射

第3章算法实现

3.1 算法的构造

3.1.1 Kernel K-means 算法构造

3.1.2 扩散距离的引入

3.1.3 线性数据

3.2 结论

参考文献

致谢

扩散距离下的Kernel K-means聚类算法的改进

论文摘要

论文目录

相关论文文献

猜你喜欢