论文摘要
支持向量机作为一个非常有效的机器学习方法,已经广泛应用于小样本、高维的分类和回归问题中。然而,在构建支持向量机模型时,一个非常重要的问题是如何优化模型参数与核参数。针对支持向量机参数优化的问题,本文首先对相关文献做了较详细的综述研究。在已有文献中,最简单直接的参数优化方法是网格搜索,但是该方法非常耗时,尤其是优化多于两个参数时;使用经典的数值优化算法最小化泛化误差边界有非常快的收敛速度,但是该类方法对初始点非常敏感,因此极易陷入局部极值点;进化算法由于具有较好的全局搜索能力,近来被许多学者用来优化支持向量机的有关参数,但是其缺乏在潜在邻域进行局部精细搜索的能力。针对已有文献中各方法的不足,本文提出了基于粒子群优化算法和模式搜索的文化基因算法,并将该算法应用到支持向量机参数优化中。在该算法中,粒子群优化算法主要负责参数空间的全局搜索和对存在最优解的潜在区域的探测,而模式搜索则在部分潜在区域中进行局部开采,以提高个体的质量。为了验证本文提出的算法的有效性,文章设计了三个实验。第一个实验研究模式搜索在该算法中的作用以及选择学习个体的策略;第二个实验和第三个实验分别将提出的算法应用到支持向量机分类和回归问题的参数优化中,结果表明,该算法与网格搜索、粒子群优化算法等常用方法和部分文献中的结果相比,有较好的准确率和稳定性。最后,总结全文并结合本文研究成果指出了下一步的研究方向。