论文摘要
湖泊富营养化问题是当今世界面临的最主要水污染问题之一,湖泊富营养化评价与水质预测是认识和研究湖泊水环境的一项重要内容,其目的是准确反映湖泊水环境的质量和污染状况,预测未来的发展趋势,是湖泊水环境管理保护和治理的一项重要基础性工作。目前在进行湖泊水质预测与富营养化评价时,存在的主要问题是没有一个被大家公认通用的具有可比性的水质预测与评价的数学模型,各部门在进行评价时,选用数学模型的任意性很大。这些方法虽然在实际应用中占据主导地位,但人们也发现它们还存在着许多不足之处。支持向量机是近年来兴起的一种新型算法,是复杂非线性科学和人工智能科学的研究前沿,由于其突出的分类与回归性能,逐渐在许多研究领域展开了广泛的应用与研究。本文试图在总结前人的已有的一些工作基础上深入研究该方法在水环境质量评价特别是湖泊富营养化评价及预测中的应用,同时对支持向量机模型参数的选取对模型精度的影响做出评价。研究结果表明,支持向量机理论与算法完全可以应用于湖泊水质预测与富营养化评价中,而且模拟结果较已有成熟方法的精度相当甚至更好,其结果合理可行。本文所研究的主要内容有如下几点:(1)对目前水环境质量评价及预测的研究方法进行系统总结。针对目前评价与预测方法存在的一些缺陷引出了支持向量机算法,简要回顾了支持向量机算法的发展历程和研究现状并总结了该算法的优点所在。(2)概述了机器学习的目的、机器学习的基本模型、机器学习的三种主要的问题、经验风险最小化原则和复杂性与推广能力。详细阐述了统计学习理论的基本思想及主要研究内容。(3)系统的介绍了支持向量机分类算法和回归机的基本原理,总结了目前支持向量机分类算法和回归机的标准算法以及各种变形算法,并对各种算法的原理进行了详细的说明,分析讨论了这些算法的优缺点,清楚全面的认识支持向量机的研究内容。同时探讨并建立了支持向量回归中的预测信任度并总结了支持向量回归机方法的特点。(4)以乌梁素海为例,以WEKA软件为实现平台,将支持向量机方法引入到湖泊富营养化评价与水质预测中来,探讨其方法在该领域的适用性。同时与已有的成熟算法进行比较分析,最后总结出支持向量机方法的优点所在。(5)总结了不同参数变化情况下对模型精度的影响,比较了ε-SVR和v-SVR两种方法的拟合精度,对乌梁素海2001年5、7、10月和2002年5、7、10月的pH进行预测并与线性回归(LR)、BP神经网络和RBF网络做了对比分析,其结果优于其它几种方法。(6)分析了造成乌梁素海冰封期水体呈富营养化的原因。本论文的创新之处有以下几个方面:(1)首次将支持向量机方法引入湖泊富营养化评价的研究领域,拓展了支持向量机的应用范围,丰富了富营养化评价方法。(2)首次将基于时间序列的支持向量回归模型应用于湖泊水质预测,且模型预测精度较其它方法有进一步的提高。(3)评价了乌梁素海冰封期的水体富营养状况并进行成因分析,这在我国湖泊富营养化的研究中尚属首次。(4)许多研究支持向量机的学者关心的是如何去寻找模型的最优参数,但却忽略了参数本身的变化对模型精度的影响,本文分析了模型精度随参数的变化而变化的趋势,为以后模型参数的选优提供一些借鉴。