扩散距离下的Kernel K-means聚类算法的改进
论文摘要
K-means算法是聚类(Clustering)问题的经典算法,Kernel K-means算法为其改进算法,用核(Kernel)的作用代替了距离(Distance)的作用,从而从维度上改变了数据的的结构,造成数据的非线性分割,这在非线性数据的情况下往往比K-means算法分类效果好。数据上的扩散映射(Diffusion Map),可以直接导出数据之间距离的定义,称为扩散距离(Diffusion Distance)。但是由于扩散距离本身的计算存在一定的复杂度,所以些算法在时间复杂度方面并不一定存在优势。本文的研究主要分为两部分:一是如何将扩散距离应用到Kernel K-means算法中,并且旨在不过多增加算法复杂度的前提下,得到更为理想的分类结果;二是如何在数据核变换的过程中,利用数据的实验结果,学习得到扩散系数等参数,从而构造出最终的算法.
论文目录
摘要Abstract第1章 背景1.1 聚类算法分类1.1.1 自动化聚类1.1.2 半自动化聚类1.2 聚类算法的一般步骤1.2.1 特征提取1.2.2 聚类算法1.2.3 聚类的有效性1.2.4 给出结论1.3 本文的工作计划第2章 理论部分2.1 聚类算法2.1.1 距离与相似度2.1.2 K-means 算法2.1.3 Kernel K-means 算法2.1.4 层次聚类2.2 扩散距离2.2.1 数据集上的 Markov 链2.2.2 扩散距离和扩散映射第3章 算法实现3.1 算法的构造3.1.1 Kernel K-means 算法构造3.1.2 扩散距离的引入3.1.3 线性数据3.2 结论参考文献致谢
相关论文文献
- [1].基于Kernel K-means的负荷曲线聚类[J]. 电力自动化设备 2016(06)
- [2].基于kernel K-means算法的城市交通客流量分析[J]. 物流技术 2013(17)
- [3].磴口县地下水埋深时空变化特征[J]. 南水北调与水利科技 2017(03)
本文来源: https://www.lw50.cn/article/05ff577a1667c7ce3b28f1dc.html