论文摘要
在现实世界中,信息系统往往会涉及到时态数据,即与时间相关且含有时间属性的数据。时态数据是按一定的时间重新划分的带有时刻的数据,用于研究数据潜在的规律特性。将时态型数据通过一定方式变形后,人们经常可以在其中发现原始时间序列所不具有的规律。随着时态数据量的日益庞大,以及人们对隐藏在数据内的潜在规律和信息的需求,时态数据挖掘便应运而生。支持向量机(SVM)是建立在统计学习理论和结构风险最小化原则之上的一项新的技术,解决了时态数据挖掘中的非线性和不确定性等问题。最小二乘支持向量机(LS-SVM)是一种改进的支持向量机。最小二乘支持向量机通过一系列的变形,最终将标准SVM的二次规划问题转化为求解线性方程组问题,提高了求解问题的精度和收敛的速度。本文将在深入分析时态数据、时态型、时间粒度等概念以及支持向量机理论的基础上,采用由原子时态型构造其他时态型的方法,构造一个以p为时间粒度的时态数据模型,并设定初始的最小二乘支持向量机训练参数——控制回归误差的可调参数r以及径向基核函数的参数s2,接着对选取的原始金融市场的股票数据进行规范化预处理。由于最小二乘支持向量机的参数r和s2必须在训练前由用户给定,并没有一定的理论依据,具有一定的主观性和先验性,因此,为了得到更好的预测效果,本文改进了一种基于群体智能的优化算法——粒子群优化(PSO)算法,对模型的参数进行优化。得到优化的参数后,本文将训练最小二乘支持向量机模型,最后给出基于最小二乘支持向量机的时态数据预测。基于最小二乘支持向量机的时态数据预测能够不仅解决时态数据挖掘中的非线性和不确定性等问题,而且提高了求解问题的精度和收敛的速度。本文将基于最小二乘支持向量机的时态数据预测应用于金融行业,对金融市场存在的海量数据进行更加深入的分析,以寻求其中有价值的信息和规律,具有重要的应用价值。