论文摘要
近几年,用学习理论解决数据分析问题已成为统计学的研究趋势之一。问题规模与复杂性日增的现实,需要更具效率的学习方法。本篇博士论文在统计学习理论的框架下,应用核方法,提出几种新的学习思路,建立了一套多核的支持向量回归机,并成功的应用于实践预测。与传统的学习方法相比较,所设计的新思路更具效率,能以低的计算代价取得期望的预测效果。传统的核学习方法包含的一个主要问题是建立学习模型后采取什么样的优化算法。基于此,本文的第一个创新点是在求解最小二乘支持向量机模型时,针对工作集的选择提出了一个单向收敛序贯最小优化算法(SD-SMO),该算法要求在迭代过程中仅优化一个拉格朗日乘子,使目标函数基于拉格朗日乘子的梯度单向收敛于0。在标准数据集上的数据试验表明,SD-SMO几乎没有降低学习精度,能有效减少算法迭代的次数,降低了计算成本。为了克服传统的核学习方法需要选择具体核的难题,针对多源数据或异构数据,研究者提出了多核学习方法(MKL)。多核学习的核通常是一族核函数的组合,由核函数族构建的学习核得出预测模型,传统的多核学习是基于l1范数,但模型的稀疏解降低了模型的预测精度。本文的第二个创新点是在l1范数的多核学习基础上,将其推广,得出基于lp(p>1)范数的多核支持向量回归模型,该模型能有效克服稀疏化解降低学习精度的问题,提高了预测效果。针对提出的基于lp(p>1)范数的多核支持向量回归模型求解,本文给出了一个相互交错、轮流优化的算法。在真实的经济数据上的试验结果表明,该方法预测效果比单核支持向量回归及基于l1,范数的多核支持向量回归模型都有明显提高。对于机理复杂、时变性强的数据,在线多核学习方法近来得到了研究者的青睐,也是当前机器学习领域中的又一个研究热点。基于此,本文的最后一个创新点是构建了一个在线多核学习预测框架,并给出了一系列的算法和理论分析。优化算法采取的是两种在线学习算法的融合,考虑到在线学习过程中计算成本逐渐增加的问题,应用了加权随机抽样策略,降低了计算成本。在标准时间序列数据集上的实证分析表明,在线多核支持向量回归预测模型以较大的计算成本获得了较好的预测效果;在采取随机抽取策略以后,能保证较高的预测精度,使学习时间明显减少。以学习理论解决数据分析问题将给统计学带来新的活力,本论文在此方面做了有益的尝试,所得成果的应用不仅仅局限于预测,其构造思路与相关理论技术也可以推广到其他学习领域,论文所做的工作丰富了数据分析处理的理论方法,对统计实践具有一定的指导意义。
论文目录
摘要Abstract目录1 绪论1.1 选题背景及其意义1.2 支持向量机的研究现状1.2.1 支持向量分类机1.2.2 支持向量回归机1.2.3 核函数1.3 论文创新点与结构安排1.3.1 论文主要创新1.3.2 论文结构安排2 支持向量机原理2.1 统计学习理论2.1.1 学习问题的表述2.1.2 经验风险最小化及VC维2.1.3 结构风险最小化原则2.2 支持向量分类机的理论与方法2.2.1 线性支持向量机2.2.2 非线性支持向量机2.2.3 最小二乘支持向量机2.3 支持向量回归机的理论与方法2.3.1 线性支持向量回归机2.3.2 非线性支持向量回归机2.4 核学习的理论与方法2.4.1 核方法的基本原理2.4.2 核函数相关的定义和理论2.5 本章小结3 支持向量机训练算法研究3.1 引言3.2 序贯最小优化算法3.2.1 序贯最小优化算法原理3.2.2 改进的序贯最小优化算法3.2.3 基于最小二乘支持向量机的序贯最小优化算法3.3 S-SMO算法3.4 实证分析3.4.1 SD-SMO算法与FO-SMO算法比较3.4.2 SD-SMO算法与SO-SMO算法比较3.5 本章小结4 多核支持向量回归机及其算法4.1 引言4.2 多核学习优化算法4.2.1 单阶段多核学习算法4.2.2 两阶段多核学习算法1范数多核支持向量回归机及相应的算法'>4.3 基于l1范数多核支持向量回归机及相应的算法1范数多核支持向量回归机'>4.3.1 基于l1范数多核支持向量回归机4.3.2 两层多核学习算法p范数多核支持向量回归机及其相应的算法'>4.4 基于lp范数多核支持向量回归机及其相应的算法p范数多核支持向量回归机'>4.4.1 基于lp范数多核支持向量回归机4.4.2 优化算法4.5 实证分析p-MKSVR与SKSVR比较'>4.5.1 lp-MKSVR与SKSVR比较p-MKSVR与l1-MKSVR比较'>4.5.2 lp-MKSVR与l1-MKSVR比较4.6 本章小结5 在线自适应多核支持向量回归机及其算法5.1 引言5.1.1 在线学习5.1.2 本章主要工作5.2 在线自适应多核支持向量回归机的框架及相应的算法5.2.1 AA-OMKRA5.2.2 AR-OMKRA5.2.3 RA-OMKRA5.2.4 RR-OMKRA5.3 实证分析5.3.1 AA-OMKRA与残差修正的在线自适应核学习算法比较5.3.2 评估随机策略的性能5.3.3 评估随机策略对支持向量个数的影响5.3.4 评估权重折扣参数v对学习精度的影响5.4 本章小结6 总结与展望6.1 创新性工作总结6.2 研究工作展望参考文献致谢攻读学位期间主要的研究成果攻读学位期间参与的项目研究及获得的奖励
相关论文文献
标签:统计学习理论论文; 单向序贯最小优化算法论文; 多核学习论文; 支持向量回归论文; 在线学习论文; 时间序列预测论文;