支持向量机的增量学习算法研究

论文摘要

支持向量机（Support Vector Machine, SVM）是在统计学习理论基础上发展起来的一种新的机器学习方法,它是统计学习理论中的结构风险最小化思想的一种实现.SVM的基本思想是通过非线性变换将输入空间变换到一个高维空间,然后在这个新的空间中求取最优分类超平面.由于最优分类超平面问题实际上是一个带有线性约束的凸二次规划问题,因此SVM算法本质是求解大规模二次规划的算法.对于这种凸二次规划问题的求解,很多学者提出了许多有效的求解方法.但对于大规模的学习问题,由于存储和计算量两方面的要求比较高,目前的各种算法还有许多困难需要克服.Mangasarian等人提出的Lagrangian支持向量机（Lagrangian Support Vector Machines, LSVM）算法把SVM的求解问题转化成只有非负约束的最小化问题.并把其最优性条件转化成对称正定互补问题,再用简单的线性收敛的迭代算法来求解.目前,线性LSVM可以处理上百万样本的数据集,但对于非线性的LSVM,尽管算法在理论上是收敛的,在实际处理大规模问题时,效果并不理想.本文基于LSVM算法,主要做了以下研究工作：（1）在深入了解Lagrangian支持向量机的基本原理和算法的基础上,提出了LSVM的在线和成批增量学习算法.每次样本增加后训练集发生变化,分类器需要更新.我们所给出的在线和成批增量学习算法充分利用了增量前的计算信息,不需要对增量后的新训练集进行重新训练,从而使得增量后矩阵逆的计算大大简化,降低了算法运行时间.为了验证所给出的LSVM的在线和成批增量算法的有效性,我们选取标准模式分类库中的9组数据集进行了实验,实验结果表明所给出的增量学习算法在保证分类正确率的情况下,有效地提高了训练速度.（2）随着增量过程的进行,训练集会越来越大,数据需要大规模的存储空间,从而导致训练速度缓慢.针对这个问题我们给出了基于LSVM的在线和成批减量学习算法.在所给出的算法中,通过矩阵的分块计算,提高了减量学习算法中矩阵逆的求解速度,算法充分利用了减量前的计算结果,避免了由于去掉一些样本而引起的重新训练.数值实验结果表明,所给出的LSVM在线和成批减量学习算法在保持原有分类精度的情况下,节省了存储空间并且降低了运行时间.（3）无论在增量学习还是减量学习过程中,选择哪些样本增加或者丢弃都很关键.为此,我们定义了样本标签的概念,给出了带有样本选择策略的增量和减量学习算法,算法利用样本标签来决定要丢掉的样本.利用该策略能有效地丢掉非支持向量,很好地保留支持向量.数值实验表明,带有样本选择策略的增量和减量学习算法也能有效节省存储空间且大大降低运行时间.（4）基于LSVR的基本原理和算法,提出了在线和成批增量回归学习算法.在LSVR的在线和成批增量回归学习算法中,当有新样本加入后,新矩阵的求逆运算利用了增量前的计算结果,不需要重新训练,从而降低算法的运行时间.通过三个真实数据集和两个生成数据集验证了在线和成批增量回归算法的有效性.随后把LSVR在线增量回归学习算法应用到时间序列预测中,并利用MSE来衡量预测误差.通过对Mackey-Glass时间序列的预测,表明该算法具有有效的预测能力和很好的抗干扰能力.通过与SVMlight和SOR-SVR算法的比较实验,表明基于LSVR的在线增量回归学习算法对于时间序列预测的有效性.（5）利用分解重构思想给出了以两分类LSVM为基础的多分类LSVM的一对一（OOLSVM）和一对多（OALSVM）两个多分类算法.在OALSVM算法中,需要解是个LSVM两类分类器；而在OOLSVM算法中,则需要解κ（κ-1）／2个LSVM两类分类器,其中κ是类别数.相比之下,标准SVM的一对一（OOSVM）和一对多（OASVM）多分类算法需要解代价比较高的二次规划问题.通过数值实验表明,我们所给出的OALSVM和OOLSVM两个算法在保持训练正确率和测试正确率的同时,明显降低了CPU的运行时间.我们利用两分类增量学习算法的思想,进一步给出了OOLSVM和OALSVM的在线增量学习算法.最后,针对现有的支持向量机算法存在的问题,我们提出了进一步研究的问题.

论文目录

中文摘要

英文摘要

第一章绪论

§1.1 课题研究背景与意义

§1.2 国内外相关研究现状

§1.2.1 支持向量机的相关研究

§1.2.2 支持向量机增量学习的相关研究

§1.3 本文主要工作概述

§1.3.1 本文的主要研究内容

§1.3.2 本文的组织结构

第二章统计学习理论与支持向量机

§2.1 机器学习的基本问题

§2.1.1 机器学习

§2.1.2 经验风险最小化

§2.1.3 复杂性和推广能力

§2.2 统计学习理论的核心内容

§2.2.1 学习过程一致性的条件

§2.2.2 VC维

§2.2.3 推广性的界

§2.2.4 结构风险最小化

§2.3 支持向量机

§2.3.1 最优分类面

§2.3.2 线性可分支持向量分类机

§2.3.3 线性不可分支持向量机

§2.3.4 非线性支持向量机

§2.4 支持向量回归机

§2.4.1 线性ε-支持向量回归机

§2.4.2 非线性ε-支持向量回归机

§2.5 小结

第三章基于Lagrangian支持向量机的增量学习算法

§3.1 引言

§3.2 Lagrangian支持向量机

§3.3 Lagrangian支持向量机的在线增量学习算法

§3.3.1 在线增量学习

§3.3.2 在线增量学习算法

§3.3.3 数值实验

§3.3.4 结论

§3.4 Lagrangian支持向量机的成批增量学习算法

§3.4.1 数值实验

§3.4.2 结论

§3.5 Lagrangian支持向量机的减量学习算法

§3.5.1 支持向量机的减量学习

§3.5.2 Lagrangian支持向量机的减量学习算法

§3.5.3 数值实验

§3.5.4 结论

§3.6 带有淘汰策略的增量和减量学习算法

§3.6.1 样本选择策略

§3.6.2 带有淘汰策略的增量和减量学习算法

§3.6.3 数值实验

§3.6.4 结论

§3.7 小结

第四章 Lagrangian支持向量回归机的增量学习算法

§4.1 引言

§4.2 Lagrangian支持向量回归机

§4.3 Lagrangian支持向量回归机的在线增量学习算法

§4.3.1 在线增量回归学习算法

§4.3.2 数值实验

§4.3.3 结论

§4.4 Lagrangian支持向量回归机的成批增量学习算法

§4.4.1 成批增量回归学习算法

§4.4.2 数值实验

§4.4.3 结论

§4.5 基于Lagrangian支持向量回归机的时间序列分析

§4.5.1 时间序列分析

§4.5.2 基于Lagrangian支持向量回归机的时间序列分析

§4.6 小结

第五章基于Lagrangian支持向量机的多分类算法

§5.1 引言

§5.2 基于Lagrangian支持向量机的多分类算法

§5.2.1 一对多多分类Lagrangian支持向量机

§5.2.2 一对一多分类Lagrangian支持向量机

§5.2.3 数值实验

§5.2.4 结论

§5.3 Lagrangian支持向量机多分类在线增量学习

§5.3.1 一对多多分类在线增量学习

§5.3.2 一对一多分类在线增量学习

§5.3.3 数值实验

§5.4 小结

第六章总结与展望

§6.1 本文工作总结

§6.2 工作展望

参考文献

攻读博士学位期间发表和完成的主要学术论文目录

致谢

支持向量机的增量学习算法研究

论文摘要

论文目录

相关论文文献

猜你喜欢