地表水源水质预测模型数据挖掘技术及其适用性研究

地表水源水质预测模型数据挖掘技术及其适用性研究

论文摘要

近年来,随着我国工业化以及城镇化进程加快,环境污染日益严重,突发环境污染事件频繁爆发,对人体健康、生态安全以及生产生活构成重要影响。松花江为黑龙江省主要饮用水源地,但目前松花江干流饮用水源地水质污染严重,已对人民生产生活造成重大影响,为此急需采用现代化手段实现对松花江流域水质的科学管理。本文以松花江流域为主要研究对象开展水质预测模型研究,本研究具有一定的理论研究价值和实际应用价值。本文利用水质在线监测系统采集水质数据,水质数据将作为水质预测模型中训练集的数据来源。为了保证预测模型具有较高的预测精度,需要把原水水质数据进行处理,形成符合要求的训练集数据,本文将数据按月分期,应用聚类分析法对数据进行处理,剔除异常数据,使有效数据能够均匀分布,提高预测精度。此外,应用聚类分析法根据诸多影响因子与预测对象之间数据分布情况,筛选出最优影响因子,合适影响因子的选择对于提高预测模型的预测精度具有较高价值。并通过测试研究验证聚类分析法处理数据后对预测精度的影响效果。本文将水体污染分为两类:常规污染和突发污染。在常规污染预测研究中,引用人工神经网络技术,应用MATLAB软件建立常规水质预测模型。预测点位置选在哈尔滨四方台监测站,以松花江流域水污染的主要指标COD Mn为预测对象,经聚类分析法研究确定当日CODMn、水温等6项参数为影响因子,并采用1997-1999年的四方台监测站日监测水质数据作为样本集,以当日6项影响因子预测未来3日CODMn,为了保证模型具有较好的预测效果,预测模型需要不断更新和维护。为了提高模型预测精度,本文将聚类中心点作为初始权值对模型进行训练,并将应用前和应用后得到的预测模型应用到水质预测中,进行对比研究,考察其应用效果。在同一水域不同水质期预测效果研究中,将松花江分为丰雨期、封冻期和其它时期,分别考察预测效果,得到结论:流域在不同的水质期,预测效果有所差异,封冻期预测效果最好,丰雨期预测效果最差,其余时期介于两者之间。在水质预测模型地域性研究中,分别应用松花江预测模型和于桥水库预测模型对松花江流域和于桥水库两地进行交叉预测研究,对比预测效果得出:不同预测模型应用到不同水域进行预测研究时,对同一种预测对象,其预测机理具有某些共性,因此未来水质的变化也有相似性。这样在一些特殊情况下,用其它水域预测模型对本水域进行水质预测,对了解本水域未来水质的变化情况也可以起到一定的借鉴作用;并且只有某水域预测模型在该水域预测时,效果最好,而在其它水域进行预测时,效果较差,因此在实际应用时,建议尽量采用本水域的预测模型对本水域进行预测研究。在不同水域水质预测效果研究中,对比具有不同水质特点的松花江流域和于桥水库预测模型的预测效果,得出:对于不同特点的水域,如果该水域水质的变化受外因影响大,水流速和水更新快的水域常规水质预测模型预测效果差,反之,预测效果就会好一些。本文对常规水质预测模型和突发水质预测模型的嵌入式集成技术进行了研究,对比了当前GIS与应用分析模型集成的三种主要方式,结合本文特点选择了预测模型与GIS紧结合模式,同时利用ActiveX自动化技术解决了MATLAB与VB集成的多目标优化,从而实现利用MATLAB函数进行水质预测模型在GIS平台上的数据输入输出功能集成,实现对水质情况进行各时间段的科学预测。在常规水质预测模型应用研究中,介绍了常规预测模型功能,并应用其对2006年8月松花江流域四方台监测站CODMn进行预测研究,考察模型的预测效果。平均预测误差为4.79%,在所允许的范围内,因此在实际的水质管理中该预测模型具有一定的指导意义。系统嵌入式集成技术研究中,突发水质预测模型选用地表水模拟模型SMS模型,系统通过调用SMS,最终形成可视化的污染物迁移模型,对地表水水质、流速、流态等进行分析。地表水源水质预测模型数据挖掘技术及其适用性研究对于指导水厂生产,为地表水环境的科学管理和决策提供了科学依据。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究目的及意义
  • 1.2 国内外水质监测预测研究现状
  • 1.2.1 水质监测研究
  • 1.2.2 水质预测预警技术研究
  • 1.2.3 水质预测模型研究
  • 1.3 论文主要研究内容
  • 第2章 技术路线和研究方法
  • 2.1 研究技术路线
  • 2.2 水质数据采集系统
  • 2.2.1 水质在线监测系统结构
  • 2.2.2 监测子站
  • 2.2.3 中心控制站
  • 2.2.4 远程通信系统
  • 2.2.5 水质监测虚拟仪器
  • 2.3 数据处理技术
  • 2.3.1 数据处理方法选择
  • 2.3.2 聚类分析法简介
  • 2.3.3 应用软件
  • 2.3.4 聚类分析法在水质数据处理中的应用分析
  • 2.4 常规水质预测方法
  • 2.4.1 常用水质预测方法
  • 2.4.2 时间序列法
  • 2.4.3 回归分析法
  • 2.4.4 灰色预测方法
  • 2.4.5 人工神经网络方法
  • 2.4.6 预测方法的比较和选择
  • 2.5 模型嵌入式集成方法
  • 2.5.1 GIS技术介绍
  • 2.5.2 GIS在嵌入式模型集成方法中的应用分析
  • 第3章 水质数据的采集和处理
  • 3.1 松花江监测优化布点及监测指标体系
  • 3.1.1 松花江流域自然状况
  • 3.1.2 松花江流域水污染状况
  • 3.1.3 监测布点优化及监测指标体系
  • 3.2 聚类分析法处理数据
  • 3.2.1 数据处理方法和步骤
  • 3.2.2 处理过程及结果分析
  • 3.3 最优影响因子的筛选
  • 3.3.1 筛选方法和步骤
  • 3.3.2 筛选过程及结果分析
  • 3.4 聚类分析法应用效果
  • 3.4.1 传统方法预测精度
  • 3.4.2 聚类分析法预测精度
  • 3.4.3 结果比较分析
  • 3.5 本章小结
  • 第4章 常规水质预测模型的建立
  • 4.1 基于人工神经网络的建模应用方法
  • 4.1.1 人工神经网络
  • 4.1.2 BP模型
  • 4.1.3 LM算法
  • 4.1.4 建模工具MATLAB
  • 4.2 模型预测思路和建模原则
  • 4.2.1 预测思路和可行性分析
  • 4.2.2 预测基本原理
  • 4.3 水质数据的处理
  • 4.3.1 预测对象和影响因子的选取
  • 4.3.2 水质数据的采集和整理
  • 4.3.3 样本集划分
  • 4.4 基于MATLAB的常规水质预测模型的建立
  • 4.4.1 模型的建立
  • 4.4.2 初始权值的选取
  • 4.4.3 网络推广能力的提高
  • 4.4.4 训练和测试模型
  • 4.4.5 训练结果分析及模型的选取
  • 4.5 聚类中心点在预测模型中的应用
  • 4.5.1 传统方法预测精度
  • 4.5.2 应用聚类中心点预测精度
  • 4.5.3 应用效果分析
  • 4.6 本章小结
  • 第5章 常规水质预测模型预测效果研究
  • 5.1 同一水域不同水质期水质预测效果
  • Mn值分析'>5.1.1 松花江CODMn值分析
  • 5.1.2 模型预测效果研究
  • 5.1.3 预测效果结果分析
  • 5.2 水质预测模型地域性
  • 5.2.1 松花江预测模型对不同水域预测效果
  • 5.2.2 不同预测模型对于桥水库预测效果
  • 5.2.3 于桥水库预测模型对不同水域预测效果
  • 5.2.4 预测效果结果分析
  • 5.3 不同水域水质预测效果
  • 5.3.1 不同水域模型预测精度对比
  • 5.3.2 预测效果结果分析
  • 5.4 本章小结
  • 第6章 水质预测模型系统化集成
  • 6.1 模型集成嵌入式技术
  • 6.1.1 系统总体概述
  • 6.1.2 系统开发环境
  • 6.1.3 系统集成关键技术与特点
  • 6.2 常规水质预测模型
  • 6.2.1 常规水质预测功能
  • 6.2.2 预测数据查询和分析功能
  • 6.2.3 模型预测效果测试
  • 6.3 突发水质污染预测模型
  • 6.3.1 模型概要
  • 6.3.2 模型运用
  • 6.4 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    地表水源水质预测模型数据挖掘技术及其适用性研究
    下载Doc文档

    猜你喜欢