基于SVM的信号分类方法的研究

基于SVM的信号分类方法的研究

日照市工业学校山东日照276800

SVM(支持向量机)是建立在SLT(统计学习理论)的基础上,其根据小样本信息在模型的复杂度和经验风险之间折中,以获得较佳的推广性。SVM的优点有:专门针对小样本的机器学习算法,最终得到有限样本下的最优解;把问题转化为一个凸二次规划问题,避免了神经网络陷入局部极值的问题;分类器具有强大的泛化能力,克服了“维数灾难”问题。SVM的这些性能已大大优于现有的许多方法,并广泛应用于各个领域。

一、SVM分类算法和设计

SVM分类算法的解释:设大小为l的训练样本集(xi,yi),i=1,2,…,l由2类数据组成,若xi∈RN属于第1类,则标记为yi=±1;若属于第2类,则标记为yi=-1。构建判别函数是为了准确地分类测试数据。本文主要针对线性情况讨论。

在SVM分类器中,不同的核函数以及参数选择对于分类器性能具有很大的影响。所以,支持向量机的设计关键在于选择合适的核函数和参数,参数选取的好坏将直接影响着分类器泛化性能的好坏。核函数的形式及其参数的确定决定了分类器类型和复杂程度,由于目前常用的核只有有限的几种,所以选择核函数的一种比较可行的方法是:对每一种核选用某种方法选出其对应的最佳核参数,然后再比较哪种核最好。

SVM分类算法的设计过程包括核函数确定和组合参数选取两部分。

1.确定核函数:已知常用的核函数有线性核函数、多项式核函数、径向基(RBF)核函数和S型核函数。在实际应用中,选用参数要根据识别任务来确定。本章研究的是SVM分类方法,所以需通过分类结果选择核函数。在MATLAB中随机生成一组与试验信号相似的数据,通过采用不同的核函数进行分类比较,以选择出最佳的核函数,相同条件下RBF核函数的分类精度最高。此外,RBF核函数本身对非线性和高维数据有很好的适应性,所以本文支持向量机的核函数为RBF核函数。

2.选取组合参数:参数组合(C,γ)中,C是SVM的惩罚因子,γ是RBF核函数的核参数,这两个参数是影响SVM的关键因素。C的作用是在确定的数据子空间中调整置信度范围,不同数据子空间中存在不同的最优C;而核参数γ则是改变样本数据子空间分布的复杂程度,即线性分类面的最大VC维,即说明线性分类达到了最小误差。Vapnike等人的研究表明了,核参数γ和误差惩罚因子C是影响SVM性能的关键因素。当C较小时推广错误率的估计值比较高;当C增加时急剧降低,即性能迅速提高;当C再继续增大时性能的变化就不明显了,而且当C增加到一定值后,错误率基本不再发生变化,即此时C的变化对推广能力的影响不明显,所以在这个区域中,就通过核参数的变化来近一步得到SVM的最优值。随着γ的变化,错误率是一个由大到小,然后再由小到大的变化过程,也就是说当γ的值确定,就可以得到SVM的最优解。所以,可以通过定一法确定最优参数组合(C,γ),以得到SVM的最优值,且此时的错误率最低。

对于一个基于RBF核函数的SVM,其性能是由参数决定(C,γ),选取不同的C和γ就会得到不同的SVM,所以目的是找到最佳的参数组合使SVM的性能最好。而最简单的方法就是根据错误率变化图,选取不同的参数组合,得出不同的错误率;分别比较这些错误率并选取其中错误率最小的参数组合作为最佳选择,这种方法就叫做“穷举法”。所以本文将分别选取参数C和γ的10个值,对10×10个(C,γ)的组合分别训练不同的SVM,再根据其推广错误率,在10×10个组合中选取错误率最小的组合作为最优参数,参数(1000,0.001)为最优化参数,此时的错误率最低。故选取C=1000和γ=0.001。

二、实验结果与分析

1.实验数据信号的大小如表1所示。

表1.信号数据集

参考文献

[1]B.E.Boser,l.M.Guyon,VN.Vapnik.ATrainingAlgorithmforOptimalMarginClassifiers[J]InD.Haussler,editor,SthAnnualACMworkshoponCOLT,Pittsburgh,PA.ACMPress.1992:144-152。

[2]KresselU.Pairwiseclassificationandsupportvectormachines[C].InScholkopfB,ed.AdvancesinKernelMethods-SupportVectorLearning,MITPress,Cambridge,Massachusetts,1999:255-268。

[3]李利杰张君华熊伟清张颖一种改进的支持向量机模型优化算法[J].计算机技术与发展,2014,12,(21),235-246。

标签:;  ;  ;  

基于SVM的信号分类方法的研究
下载Doc文档

猜你喜欢