论文摘要
随着计算机技术的飞速发展,现实生活中存在的多种形态的大规模数据成指数级增长。如何对海量、稀疏、低秩、含噪声的数据进行快速有效地处理,进而从中提取出对人们有价值的数据信息,是统计学与计算机科学等相关领域的研究工作者普遍关注的问题。数据低秩约束是一种普遍存在的现象,如何在低秩约束的前提下进行数据处理成为近年来研究者关注的焦点问题之一。本文从低秩约束出发,分别研究了数据的分类问题和特征分析问题。具体而言,本文的主要研究内容如下:1.分析总结了低秩约束的相关理论。对国内外已有的关于低秩约束理论的发展和研究现状进行了细致地总结、分类,对三种主要的低秩约束理论(包含低秩矩阵恢复、低秩矩阵补全以及低秩矩阵表示)及其算法做了详细的阐述和分析。2.在低秩约束的基础上,提出了一种新的数据分类方法。针对数据的低秩特性,提出了一种基于非负矩阵分解和调和函数的数据分类学习方法。在对非负矩阵分解理论的基本原理和调和函数性质的深入分析基础上,将非负矩阵分解理论和调和函数融合在一起进行数据分类。在实际数据上与传统的分类方法进行对比实验,得到满意的实验结果。3.在低秩约束的基础上,提出了新的数据特征分析方法。从低秩约束理论出发,提出了一种基于邻域保持嵌入和稀疏正则化的数据特征分析方法。深入分析了邻域保持嵌入方法和稀疏正则化的性质,在邻域保持嵌入方法的基础上引入关于稀疏的L2,1正则项,对数据进行特征选择。文中做了大量的实际数据比对实验,与传统的特征选择方法比较,结果表明该方法在某些性能上具有优势。
论文目录
相关论文文献
标签:低秩约束论文; 非负矩阵分解论文; 调和函数论文; 邻域保持嵌入论文; 稀疏正则化论文; 数据分类论文; 特征选择论文;