论文摘要
在信息时代的科学研究中,我们不可避免的会遇到大量的高维数据,这就要求我们对高维数据进行处理。降维算法是处理高维数据的一个重要手段,也是特征提取的重要方式。降维的主要目的是在保持原始高维数据的内在结构的提前下,将在高维空间中的原始数据映射到低维欧氏空间上,以实现维数简约,从而使数据的处理更高效、更便捷。线性降维算法具有较强的数学基础,但是其线性本质并不能揭示复杂的非线性流形,于是又出现了以ISOMAP(等距特征映射)、LLE(局部线性嵌入)、LE(拉普拉斯特征映射)等为代表的非线性流形学习算法。本文主要在分析等距特征映射算法基础上探讨了对其的改进算法,并应用到了工程中。主要做了以下工作:1、分析和研究ISOMAP算法,以及核ISOMAP(K-ISOMAP)算法的原理和步骤。传统的K-ISOMAP算法对于多个分散类簇数据集的低维映射不能较好地表现数据集的内在拓扑结构。因此,将多类多流形算法(MCMM-ISOMAP)中构造邻域图的方法应用到K-ISOMAP算法中,得到一种核化的多类多流形ISOMAP(K-MCMM-ISOMAP)方法。该方法不仅解决了多个分散类簇在低维映射空间中不能较好保持数据集内在拓扑结构特性的问题,而且能够将新的测试数据直接从高维空间映射到低维空间,从而在多类图像数据集中实现图像检索的功能。2、针对化工连续生产过程的时序性及非线性等特征,将一种基于K-ISOMAP、 LDA和KNN集成的非线性故障诊断方法:K-ISOMAP-LDA-KNN方法,应用于化工过程的故障诊断中。首先采用核等距特征映射(K-ISOMAP)算法在保持训练数据内在几何结构前提下进行非线性降维。然后使用线性判别(LDA)算法保持数据的最佳分类效果下进行降维,完成过程的特征提取。最后用K近邻(KNN)算法进行模式分类。将方法应用于仿真化工TE(Tennessee Eastman)过程故障诊断,结果验证了该故障诊断方法有较高的辨识能力。
论文目录
相关论文文献
标签:流形学习论文; 非线性降维论文; 核等距特征映射论文; 多类多流形等距特征映射论文; 故障诊断论文;