论文摘要
具有增量学习功能的数据分类技术正逐渐成为当前信息处理的关键技术之一。与传统的数据分类技术相比,增量学习分类技术具有显著的优越性。这主要表现在两个方面:一方面由于其无需保存历史数据,从而减少存储空间的占用;另一方面增量学习在当前的样本训练中充分利用了历史的训练结果,从而显著地减少了后续训练的时间。基于支持向量机的增量学习在国内外引起广泛的关注。在深入分析了支持向量机的性能依赖于核函数的选择后,提出了一种拟合给定训练样本最优核的算法。针对新采集的样本中包含相同维数的新增特征的情形,提出了基于最小二乘支持向量机的特征增量学习算法。针对新采集的样本中包含不同维数的新增特征的情形,提出了增量式边缘最大化学习算法。本文工作的主要贡献和创新总结如下:1.提出了一种构造给定训练样本最优核的算法。根据最优核的构造理论,对于给定的训练样本,最优核由基本核的有限凸组合构成。该算法利用训练样本的单个特征作为基本核并利用这些基本核的凸组合来构造最优核。2.提出了基于最小二乘支持向量机的增量特征学习算法来处理后采集的样本含有新增特征且新增特征的维数相同的情形。该算法利用先前训练的结构参数,仅对后采集的新增特征采用最小二乘支持向量机进行训练。实验结果表明:该算法在节省训练时间的同时,能取得与标准最小二乘支持向量机相当或更好的分类正确率。3.提出了增量式缺失特征的边缘最大化学习算法来处理后采集的样本含有新增特征且新增特征维数不同的情形。该算法利用原有特征训练的结构参数,仅对后采集的不同维的新增特征采用边缘最大化学习算法进行训练。实验结果表明,随着缺失比率和后采集的特征维数的增加,增量式缺失特征的边缘最大化学习算法表现出更好的分类性能。论文中实验数据来自机器学习公共数据集UCI,在Matlab R2007a环境下对提出的算法进行了实验,并对实验结果进行了详细分析。
论文目录
相关论文文献
标签:支持向量机论文; 增量学习论文; 缺失特征学习论文; 边缘最大化算法论文; 最小二乘支持向量机论文;