化学化工数据挖掘技术的研究

化学化工数据挖掘技术的研究

论文题目: 化学化工数据挖掘技术的研究

论文类型: 博士论文

论文专业: 化学工程与技术

作者: 束志恒

导师: 陈德钊

关键词: 效据挖掘,粗糙集方法,属性筛选,离散化,决策表的约简,化学模式分类建模,化工过程建模

文献来源: 浙江大学

发表年度: 2005

论文摘要: 化学化工是一门实践性很强的学科,随着计算机技术的发展,积累了大量的数据,数据挖掘技术的发展为从这些数据获取有用知识提供了有力的工具。数据挖掘方法的有效性,总是与各个领域的数据特点紧密的结合在一起。本文针对化学化工领域中的数据具有高维、复共线性和带有噪音的特点,利用神经网络、粗糙集方法、模糊系统以及统计方法,对属性筛选、连续属性的离散化、规则获取、化学模式分类建模、化工过程建模进行了研究,并介绍了数据挖掘方法和粗糙集的基本理论和方法,以及化学化工数据挖掘所面临的问题。主要内容如下:1、 提出一种基于正则化网络-遗传算法的属性筛选方法。根据神经网络剪枝中的正则化方法和灵敏度分析方法,采用贝叶斯正则化方法对网络进行训练,然后利用神经网络分类器的特性设计选择算子,利用遗传算法对神经网络的输入单元进行剪枝,从而达到属性筛选的目的。在留兰香高维模式的属性筛选中,说明了本方法优于其它方法。2、 针对粗糙集方法只能处理离散型数据,提出一种基于X2统计量的离散化方法RSE-Chi2。本方法是一种合并型的离散化方法,以X2统计量的大小作为是否合并依据,以决策系统的不确定度量函数作为离散化停止标准,通过基于背景知识的特征价值度量大小来安排各个属性离散化顺序。本方法的优点是将连续属性的离散化和特征选择有机的结合在一起,自动确定合适的离散化程度。3、 在基于粗糙集的分类规则获取中,为了使所得规则具有良好的泛化性能,并使基于规则的分类模型具有较好的推广性,提出了以下方法:采用RSE-Chi2方法,将决策系统的连续属性离散化和属性约简结合在一起,消除冗余的划分断点,使所得约简具有较好的推广性;在分辨矩阵的基础上,采用贪心算法,每次选入分类能力最强的属性值,以获得值约简的满意解;根据所得规则参数的统计性质,以及与样本条件属性值的匹配程度,对未知类别样本进行预测。在橄榄油的分类规则获取和分类建模应用中,所得结果易于理解,无需先验知识,具有较好的预测准确度。浙江大学博士学位论文 4、根据连续属性离散化后所得知识的模糊性,将粗糙集方法与模糊方法相结合,并根据神经网络原理来调整有关参数,提出了以下方法:根据粗糙集方法所得规则构建了一种用于分类的模糊一神经网络系统,利用规则参数的统计性质和离散化结果对网络参数进行初始化,并给出训练方法;提出基于粗糙集的回归分析方法,由此获得用于回归建模的模糊规则,构建用于回归建模的模糊一神经网络系统,给出了网络初始化方法和训练方法。将这两种方法分别用于化学模式分类建模和化工过程建模,具有训练速度快,网络结构简单,易于理解,推广性良好,优于统计方法和前馈神经网络方法。关键词数据挖掘粗糙集方法属性筛选离散化决策表的约简 化学模式分类建模化工过程建模

论文目录:

摘要

ABSTRACT

第一章 绪论

1.1 引言

1.2 数据挖掘的定义

1.3 数据挖掘的分类与任务

1.4 数据挖掘的方法

1.5 数据挖掘面临的问题

1.6 本文的研究内容

第二章 基于正则化神经网络-遗传算法的属性筛选

2.1 引言

2.2 属性筛选的标准

2.3 基于神经网络的属性筛选

2.3.1 神经网络的剪枝

2.3.2 基于神经网络的属性筛选

2.4 贝叶斯正则化与网络训练

2.4.1 贝叶斯定理

2.4.2 确定正则化系数的贝叶斯方法

2.4.3 贝叶斯正则化网络的训练

2.5 基于正则化网络-遗传算法的属性筛选

2.5.1 网络剪枝和属性筛选

2.5.2 用于剪枝的遗传算法

2.6 留兰香模式的属性筛选

2.6.1 网络训练和参数设定

2.6.2 属性筛选的结果

2.6.3 选出属性建立分类模型

2.7 小结

第三章 粗糙集理论与方法

3.1 引言

3.2 粗糙集理论的基本概念与方法

3.2.1 信息系统和决策表

3.2.2 不可分辩关系

3.2.3 上下近似集与粗糙集

3.2.4 粗糙成员函数

3.2.5 属性约简与核

3.2.6 属性的依赖性

3.2.7 属性的重要性

3.2.8 分辩矩阵

3.2.9 决策规则

3.3 粗糙集的扩展模型

3.4 基于粗糙集理论的知识不确定性度量

3.5 粗糙集方法与其它智能方法的结合

3.6 粗糙集在数据挖掘中的应用及其存在的问题

3.7 小结

第四章 连续属性的离散化

4.1 引言

4.2 离散化方法

4.3 基于卡方统计的离散化方法

4.3.1 x~2分布检验及其应用

4.3.2 卡方统计量在离散化中的应用

4.4 RSE-Chi2离散化方法

4.4.1 特征价值度量方法

4.4.2 数据预处理

4.4.3 离散化操作步骤

4.5 实例测试比较

4.6 小结

第五章 决策表约简及其应用

5.1 引言

5.2 决策表的属性约简

5.2.1 常用的属性约简方法

5.2.2 属性约简的选择标准

5.2.3 连续属性决策系统的属性约简

5.3 决策表的值约简

5.3.1 值约简算法

5.3.2 改进的值约简算法

5.4 决策规则的运用

5.4.1 决策规则的参数

5.4.2 决策规则参数的合并

5.5 橄榄油样本数据中的分类规则挖掘

5.5.1 数据准备和离散化

5.5.2 决策表的约简

5.5.3 分类决策模型的推广性

5.6 小结

第六章 粗糙集与模糊系统的集成分类方法

6.1 引言

6.2 模糊集合和模糊逻辑的基本概念与方法

6.3 模糊推理分类系统

6.3.1 模糊分类规则

6.3.2 模糊推理分类

6.3.3 基于粗糙集方法的模糊系统结构辨识

6.4 模糊-神经网络分类系统

6.4.1 模糊-神经网络的结构及其各层含义

6.4.2 模糊-神经网络的训练

6.4.3 模糊-神经网络的参数初始化

6.4.4 粗糙集方法与模糊推理系统的集成分类方法

6.5 用于橄榄油分类的模糊-神经网络方法

6.6 小结

第七章 粗糙集与模糊系统集成的过程建模方法

7.1 引言

7.2 模糊推理回归系统

7.3 基于粗糙集的回归分析方法

7.3.1 决策属性值的离散化

7.3.2 不一致情况下的处理

7.3.3 决策规则的后处理

7.3.4 基于粗糙集的回归方法的优缺点及改进

7.4 用于回归建模的模糊-神经网络

7.4.1 模糊-神经网络的结构

7.4.2 模糊-神经网络系统的初始化

7.4.3 模糊-神经网络系统的训练

7.5 化工过程的粗糙-模糊推理系统方法建模

7.5.1 基于粗糙-模糊推理系统的方法

7.5.2 PTA装置溶剂脱水塔精馏过程及其建模

7.6 小结

第八章 总结与展望

8.1 研究工作总结

8.2 工作展望

参考文献

致谢

攻读博士学位期间完成的论文和科研项目

发布时间: 2005-04-29

参考文献

  • [1].有序决策系统的知识更新理论及其高效算法[D]. 李少勇.西南交通大学2014

相关论文

  • [1].基于数据挖掘的若干化工过程优化和化合物构效关系研究[D]. 杨善升.上海大学2008
  • [2].基于数据挖掘的智能决策研究[D]. 张文宇.西北工业大学2003
  • [3].粗糙集理论在数据挖掘领域中的应用[D]. 马昕.浙江大学2003
  • [4].化学信息学中的数据挖掘[D]. 胡黔楠.中南大学2004
  • [5].基于粗糙集的数据挖掘方法研究[D]. 崔广才.吉林大学2004
  • [6].化工动态优化方法的研究与应用[D]. 张兵.浙江大学2005
  • [7].过程控制中的数据挖掘技术研究及其智能控制策略探讨[D]. 赵晨.浙江大学2005
  • [8].基于支持向量机的过程工业数据挖掘技术研究[D]. 张英.浙江大学2005
  • [9].数据挖掘和人工智能理论在短期电力负荷预测中的应用研究[D]. 冯丽.浙江大学2005
  • [10].流程工业粒度数据挖掘技术研究与应用[D]. 耿志强.北京化工大学2005

标签:;  ;  ;  ;  ;  ;  ;  

化学化工数据挖掘技术的研究
下载Doc文档

猜你喜欢