论文题目: 基于支持向量机的过程工业数据挖掘技术研究
论文类型: 博士论文
论文专业: 控制理论与控制工程
作者: 张英
导师: 褚健,苏宏业
关键词: 过程工业,数据挖掘,支持向量机,对二甲苯,精对苯二甲酸
文献来源: 浙江大学
发表年度: 2005
论文摘要: 论文以聚酯工业产业链中的两个关键过程对二甲苯(Para-Xylene,简称PX)吸附分离、氧化过程为背景,以SVM方法为工具,从数据挖掘的角度分别对预言型数据挖掘和探索型数据挖掘在PX工业中的应用进行了研究。最后在提出算法的基础上实现了一个数据挖掘的软件平台ESP-PISDMS。论文主要的研究工作可以概括为如下几个方面, (1) 提出了一种改进的SVM分类算法。从测试样本是否满足KKT条件出发,分析新增样本和原有样本交互学习中支持向量集构成的变化,将尽可能多的可能包含支持向量的样本选入当前的工作训练集中,提高算法精度。通过合理地划分样本集的大小,和传统的算法相比该算法在处理大规模样本时具有较高的精度和训练速度,并且非常适用于在线增量学习。 (2) 提出了两种基于SVM的增量建模方法SVMIL和ISVM,随着时间推移,每次在模型中增加一批(一个)样本进行增量学习的同时,采用启发式策略去掉工作集中一批(一个)样本,这样可以在软测量建模中不断增加能够代表新工况信息样本的同时控制工作样本集的规模。将提出的软测量建模方法用于PX吸附分离过程PX纯度的预测中,并和其他方法作了比较。 (3) 提出了两种用于模糊SVM的模糊隶属度函数-基于κNN的隶属度函数和基于支持向量数据域描述(SVDD)的隶属度函数。前者在特征空间中根据样本与其最临近样本点的距离来确定其隶属度,后者首先得到训练集中样本的数据域描述模型,然后根据每个样本偏离数据域的程度赋予不同的隶属度。将提出的模糊隶属度函数模型及其建模方法用于工业PX氧化过程中4-CBA浓度预测的问题中,并和其他方法作了比较,提出的模型可以有效减少回归误差,提高SVM抗噪声的能力。 (4) 提出了一种基于SVM的超矩形规则提取算法HRE。在HRE算法中,数据样本先被映射到一个高维的特征空间中,用于得到样本的最优分类超平面以及支持向量,然后在一些启发式条件的限制下,在得到的支持向量和聚类中心的基础上构建超矩形规则。在HRE中控制规则的支持度以及数量非常容易,得到的规则具有更高的质量。
论文目录:
摘要
ABSTRACT
目录
第一章 绪论
1.1 数据挖掘技术及其应用
1.1.1 数据挖掘
1.1.2 过程工业数据特点
1.2 统计学习理论及支持向量机
1.2.1 经验风险最小化原则
1.2.2 统计学习理论的核心内容
1.2.3 学习过程一致性的条件
1.2.4 结构风险最小化原则
1.2.5 支持向量机
1.3 SVM的研究进展
1.3.1 SVM训练算法研究
1.3.2 SVM的派生方法
1.3.3 SVM的模型选择
1.3.4 SVM的应用研究
1.4 PX、PTA工业发展现状
1.5 论文主要内容及安排
第二章 一种改进的SVM分类算法FS-SVM
2.1 引言
2.2 SVM训练算法
2.3 KKT条件几何解释
2.4 改进的SVM分类算法FS-SVM
2.5 FS-SVM算法训练步骤
2.6 仿真结果和分析
2.6.1 UCI ADULT数据集
2.6.2 工业PX氧化过程数据集
2.7 小结
第三章 SVM增量学习及其在PX吸附分离中的应用
3.1 引言
3.2 支持向量回归
3.3 SVR中的KKT条件
3.4 支持向量数据域描述
3.5 过程描述
3.6 基于SVMIL的软测量建模
3.6.1 SVM增量学习
3.6.2 等量替换策略
3.6.3 SVMIL算法建模步骤
3.6.4 仿真结果
3.7 基于ISVM的软测量建模
3.7.1 增量SVM
3.7.2 启发式样本替换策略
3.7.3 ISVM算法建模步骤
3.7.4 数值仿真
3.8 两种算法的比较分析
3.9 小结
第四章 模糊SVM及其在工业PX氧化中的应用
4.1 引言
4.2 PX氧化过程描述
4.3 模糊支持向量回归FSVR
4.3.1 支持向量回归
4.3.2 SVR对孤立点的过拟合
4.3.3 模糊支持向量回归
4.4 模糊最小二乘支持向量机FLS-SVM
4.4.1 最小二乘SVM函数估计
4.4.2 模糊最小二乘SVM函数估计
4.5 模糊隶属度的确定
4.5.1 现有模型及其特点
4.5.2 基于KNN的模糊隶属度
4.5.3 基于SVDD的模糊隶属度模型
4.6 仿真结果及讨论
4.7 小结
第五章 支持向量机规则提取
5.1 引言
5.2 超矩形规则提取算法HRE
5.2.1 支持向量聚类算法SVC
5.2.2 超矩形规则的支持度和置信度
5.2.3 超矩形规则
5.2.4 超矩形规则的构建
5.2.5 HRE中参数影响
5.3 仿真结果和讨论
5.4 小结
第六章 基于SVM的关联规则挖掘及其在PX吸附分离过程中的应用
6.1 引言
6.2 工业PX吸附分离过程描述
6.2.1 PX生产工艺
6.2.2 SMB吸附分离原理
6.2.3 IFP/ELUXYL PX生产工艺
6.3 超矩形关联规则挖掘算法HARM
6.3.1 关联规则挖掘
6.3.2 规则的合并
6.3.3 规则的简化
6.3.4 HARM规则挖掘算法步骤
6.4 仿真结果和讨论
6.5 小结
第七章 过程工业数据挖掘系统模型及其实现
7.1 引言
7.2 数据挖掘过程模型
7.2.1 通用数据挖掘模型
7.2.2 CRISP-DM数据挖掘模型
7.2.3 SEMMA数据挖掘模型
7.2.4 其他数据挖掘处理模型
7.3 过程工业数据挖掘5P模型
7.4 ESP-PIDMS数据挖掘软件
7.4.1 常用数据挖掘软件
7.4.2 常用的数据挖掘模式及其技术
7.4.3 ESP-PIDMS特征
7.4.4 ESP-PIDMS系统构架
7.4.5 ESP-PIDMS挖掘模式及算法
7.4.6 ESP-PIDMS运行界面及其应用
7.5 小结
第八章 结论与展望
8.1 论文内容总结
8.2 展望
附录一:SVM中二次规划的KKT条件
附录二:世界PX生产、消费情况以及需求预测
附录三:常用的数据挖掘软件以及算法
附录四:ESP-PIDMS、SAS/EM、IBM/IM、CLEMENTINE中算法比较
附录五:ESP-PIDMS中主要数据结构
附录六:ESP-PIDMS过程应用建模实例
作者在攻读博士学位期间发表论文
致谢
发布时间: 2005-07-27
参考文献
- [1].结合可视化与数据挖掘的数据分析方法探究[D]. 马昱欣.浙江大学2017
- [2].正则化方法在数据挖掘中的应用与研究[D]. 姜彦.湖南大学2015
- [3].时间序列数据挖掘研究与应用[D]. 王达.浙江大学2004
- [4].粗糙集理论在数据挖掘领域中的应用[D]. 马昕.浙江大学2003
- [5].序列数据挖掘的模型和算法研究[D]. 杨虎.重庆大学2003
- [6].数据挖掘相关算法的研究与平台实现[D]. 李秋丹.大连理工大学2004
- [7].数据挖掘方法研究及其在中药复方配伍分析中的应用[D]. 李力.西南交通大学2003
- [8].化学信息学中的数据挖掘[D]. 胡黔楠.中南大学2004
- [9].Rough Set理论及其在数据挖掘中的应用研究[D]. 于洪.重庆大学2003
- [10].KDD中的几个关键问题研究[D]. 陈莉.西安电子科技大学2003