论文摘要
数据降维在机器学习和数据挖掘领域中有着广泛的应用,数据降维方法对数据进行预处理,大大降低了程序的时间和空间复杂度,所以数据降维方法的研究成为机器学习领域的一个热点。传统的数据降维方法只能解决具有线性结构的数据集,对于非线性数据集不适用。从而非线性降维方法的研究引起广大科研工作者的兴趣。本文研究基于流形学习的非线性数据降维方法。流形学习假设数据点分布于一个光滑的流形上,然后对想保留的性质进行刻画,最后通过谱方法获得高维数据的低维表示。本文首先对目前典型的流形学习方法与核函数理论进行较为全面的分析,并对LE (Laplace Eigenmaps)算法进行核化。此外,提出了一种PCA(Principal Component Analysis)和LLE(Local Linearly Embedding)混合数据降维方法,并在经典数据集和具有挑战性的数据集上取得了较好的降维效果。为了进一步说明此算法的有效性,本文将此算法应用于手写字分类和人脸分类算法的预处理过程中,得到了预期的效果。为了说明此算法的有效性,本文又进一步从理论上进行了分析。
论文目录
摘要Abstract第一章 绪论1.1 数据降维研究的意义1.2 数据降维问题描述1.3 数据降维方法概述1.4 本文工作1.5 本文结构第二章 典型的数据降维方法2.1 线性降维方法2.1.1 主成分分析法2.1.2 多维尺度法2.2 非线性降维方法2.2.1 流形学习中图构建方法2.2.2 局部线性嵌入法2.2.3 等距嵌入法2.2.4 拉普拉斯特征映射法2.3 本章小结第三章 基于核理论的LE算法3.1 引言3.2 核化主成分分析法3.3 核化局部线性嵌入法3.4 核化拉普拉斯特征映射法3.5 本章小结第四章 一种PCA与LLE混合数据降维算法4.1 引言4.2 PLE方法介绍4.3 PLE方法分析4.4 实验4.4.1 实验环境4.4.2 经典数据集4.4.3 更具挑战性的数据集4.4.4 手写字数据集和人脸数据集4.5 本章小结第五章 总结与展望5.1 本文工作总结5.2 未来工作展望5.2.1 流形学习方法的Banach空间推广5.2.2 流形学习方法的多核理论推广5.2.3 构造新核函数的流形学习理论参考文献致谢
相关论文文献
标签:流形学习论文; 数据降维论文; 核方法论文; 分类论文;