基于支持向量机和流形学习的分类方法研究

基于支持向量机和流形学习的分类方法研究

论文摘要

分类器设计和特征提取技术一直是模式识别研究的两个重要课题,受到军用和民用领域广阔应用背景的驱使,近十年来,其在理论和应用方面得到了迅猛的发展,不断涌现出许多新的方法,而支持向量机(SVM)和流形学习的性能显得尤为突出。本文针对这两个热点技术在实际应用中存在的不完善之处,从SVM多分类、非平衡样本的分类、集成学习以及基于流形学习的线性特征提取方法等几个方面进行了深入的研究,提出了一些合理有效的新方法。本文的研究成果主要包括以下几个方面:1.结合自组织映射(Self-Organizing Map,SOM)的非线性和拓扑有序性的特点,提出了一种基于SOM解码的SVM多分类方法。该方法利用二分类SVM输出的幅值信息,避免了同时与多个类别距离最小的情况,克服了不确定问题,优于目前使用的基于汉明距离的解码方法,特别是对于简单的OVA编码方式,效果更为明显。同时,揭示了对于多分类问题,并非使用的二分类器的数量越多性能就越好,存在一个最优码长,码字的选择将影响分类效果。2.针对实际应用中正负样本数量分布不平衡的分类问题,提出了一种修正的近似SVM(PSVM)算法。通过在原始PSVM的优化问题中引入一个对角阵,进而对正负样本分配不同的惩罚因子,使得其能够适应数量分布不平衡的数据集,拓展了PSVM的应用范围,利用拉格朗日方程、Sherman-Morrison-Woodbury公式和矩形核的思想,推导了线性和非线性情况下的决策函数。3.特征选择是构造集成学习算法的一种有效策略,它能够为个体学习算法提供不同的特征子集。借助特征选择算法(Relief(F))能够非线性优化特征权值的特性,提出了一种基于Relief算法的PSVM集成方法,解决了单纯扰动训练数据对于PSVM集成效果不明显的问题,该算法在提高个体PSVM性能的同时,兼顾了个体之间的差异,从而提高了集成系统的泛化能力和鲁棒性。4.在基于流形学习的线性特征提取算法(邻域保护嵌入,NPE)的基础上,提出了一种正交邻域保护嵌入算法(ONPE)。首先定义一个邻域保护函数,以反映投影向量的邻域保护性能。然后通过增加一组正交约束条件,构成新的优化问题,推导得到一组具有正交性的投影向量,从而具有更优越的邻域保护能力。利用邻域保护性能和特征的类别判别能力之间的关系,使得该算法提取的特征具有更好的分类性能。5.利用核思想,提出一种基于核邻域保护嵌入算法(KNPE)的非线性特征提取方法,意在保护非线性特征空间中的邻域结构。由于该算法利用了数据的高阶信息,因而对于样本的描述更加丰富和细致,同时继承了NPE的局部特性最优的性质,使提取的特征更加有效。在求解广义特征值问题中,结合了特征空间中的邻域保护函数和核矩阵的QR分解,有效地克服了KNPE算法中的奇异性问题;在深入分析KNPE算法特性的基础上,找到了KNPE算法的本质,即KNPE=KPCA+NPE,由此得到了求解KNPE的一种简单易行的方法。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 支持向量机研究现状
  • 1.2.1 SVM算法
  • 1.2.2 SVM的应用
  • 1.3 流形学习研究现状
  • 1.3.1 主流形算法
  • 1.3.2 谱分析算法
  • 1.3.3 变分法
  • 1.3.4 互信息法
  • 1.4 论文的主要研究内容与章节安排
  • 第二章 支持向量机与流形学习
  • 2.1 引言
  • 2.2 支持向量机
  • 2.3 流形学习方法
  • 2.3.1 流形学习理论
  • 2.3.2 流形学习与降维
  • 2.3.3 流形学习方法分析
  • 2.4 本章小结
  • 第三章 基于SOM解码的支持向量机多分类方法
  • 3.1 引言
  • 3.2 多类支持向量机的分类机理
  • 3.2.1 训练阶段
  • 3.2.2 分类阶段
  • 3.3 基于SOM解码的支持向量机多分类方法
  • 3.3.1 自组织映射网络
  • 3.3.2 基于SOM解码的SVM多分类过程
  • 3.4 实验与分析
  • 3.4.1 Iris数据实验
  • 3.4.2 人脸数据库实验
  • 3.5 本章小结
  • 第四章 用于非平衡样本分类的近似支持向量机
  • 4.1 引言
  • 4.2 近似支持向量机
  • 4.3 用于非平衡分布样本的改进近似支持向量机
  • 4.3.1 线性MPSVM
  • 4.3.2 非线性MPSVM
  • 4.3.3 MPSVM算法的运算机理分析
  • 4.4 实验与分析
  • 4.4.1 人造数据实验
  • 4.4.2 UCI数据实验
  • 4.4.3 雷达一维距离像的识别
  • 4.5 本章小结
  • 第五章 基于Relief(F)算法的近似支持向量机集成
  • 5.1 引言
  • 5.2 基于Relief(F)算法的PSVM集成
  • 5.2.1 近似支持向量机
  • 5.2.2 基于Relief(F)算法的PSVM集成
  • 5.3 实验与分析
  • 5.3.1 UCI数据实验
  • 5.3.2 雷达一维距离像的识别
  • 5.4 本章小结
  • 第六章 正交邻域保护嵌入算法
  • 6.1 引言
  • 6.2 基于邻域保护嵌入算法的特征提取方法
  • 6.2.1 NPE算法
  • 6.2.2 NPE算法的几何解释
  • 6.3 基于正交邻域保护嵌入算法的特征提取方法
  • 6.3.1 正交 NPE算法
  • 6.3.2 算法的推导
  • 6.3.3 邻域保护能力分析
  • 6.4 实验与分析
  • 6.4.1 二维数据可视化实验
  • 6.4.2 人脸数据库实验
  • 6.5 本章小结
  • 第七章 核邻域保护嵌入算法
  • 7.1 引言
  • 7.2 核机器学习
  • 7.3 核邻域保护嵌入算法
  • 7.3.1 核邻域保护嵌入算法(KNPE)
  • 7.3.2 核邻域保护嵌入算法性能分析
  • 7.4 实验与分析
  • 7.4.1 UCI数据实验
  • 7.4.2 雷达一维距离像的识别
  • 7.4.3 人脸数据库实验
  • 7.5 本章小结
  • 附录
  • 总结与展望
  • 致谢
  • 参考文献
  • 作者在攻读博士学位期间撰写的论文
  • 攻读博士期间参加的科研工作
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    基于支持向量机和流形学习的分类方法研究
    下载Doc文档

    猜你喜欢