论文题目: 定量结构活性相关性研究中的新型化学计量学算法研究
论文类型: 博士论文
论文专业: 分析化学
作者: 申琦
导师: 俞汝勤,沈国励
关键词: 定量构效关系研究,变量选择,目标函数,粒子群优化算法,蚁群优化算法,神经网络,进化算法
文献来源: 湖南大学
发表年度: 2005
论文摘要: 本论文通过对定量结构与活性主要是生化活性相关性研究中的一些难点问题的研究,提出了几种新型的化学计量学算法。1. 将粒子群优化算法改进,以适用于离散的组合优化问题,并减少了原算法陷入局部最优的几率。将改进的粒子群优化算法用于多元线性回归和偏最小二乘的变量选择,并用于血管紧缩素Ⅱ拮抗物的拮抗活性的研究。结果表明改进的粒子群优化算法能搜索到最优的变量组合,具有较快的收敛速度。2. 分析了一些训练神经网络的算法引起网络过拟合、局部最优的原因,将杂交的粒子群优化算法用于自适应训练多层前向神经网络。连续粒子群算法用于训练神经网络的权重,改进的离散粒子群算法用来确定网络的适宜结构。两种类型的粒子群优化算法相结合同时用于训练网络的结构和连接度。我们还提出了一个新的目标函数来确定适宜的网络结构和权重的最优值。我们用所提出的神经网络训练算法对芳香胺的致癌活性和偏端霉素类化合物的活性进行预测,并与用粒子群优化算法和遗传算法仅训练网络权重的结果做了对比,在这些方法中网络的拓扑结构是固定的。结果表明用所提出的杂交粒子群优化方法自适应训练神经网络能很快收敛到最优解,并在一定程度上避免了陷入局部最优和过拟合现象。3. 提出了粒子群优化分段建模的方法,首先用最小生成树方法对训练集中所有化合物聚类成最小生成树,再用改进的离散粒子群算法去分割最小生成树以获得满意的分段线性模型,还定义了一个新的目标函数来确定最优的分段线性模型。将粒子群优化分段建模方法用于预测1,2,4-三唑类化合物对血管紧缩素Ⅱ的拮抗活性,结果表明所提出的方法能有效的提高回归模型的拟合力。4. 改进了蚁群优化算法,将其用于构效关系研究的变量选择中,并将改进的蚁群优化算法用于1,2-二芳基咪唑类化合物的环氧酶-2抑制活性的定量构效关系分析。所得的结果与进化算法相对比可知,改进的蚁群优化算法比较简单,需要调节的参数少,是变量选择的有效方法,具有满意的收敛特性,能搜索到最优的变量。5. 修正了Cp统计量作目标函数来评价构效关系研究中变量的重要性,并与进化算法结合来搜索不同的变量组合,将其用于芳香胺的致癌活性的构效关系研究获得了满意的结果。另外,在酪氨酸激酶抑制剂的构效关系研究中,提出了新的电性参数(Qo,Qm和Qp)来描述取代基的性质,其中电性参数Qm描述取代基的性质显示了较好的结果。6. 通过一个岭参数构造正交信号校正的估计,提出了岭正交信号校正(ROSC),在一定程度上克服了去除有用信息的问题。论文中采用了广义交互检验定量结构与活性相关性研究中的新型化学计量学算法研究方法选择岭系数和确定正交信号校正组分数。对苯胺硫化物类化合物的环氧酶一2抑制活性的构效关系研究的结果表明:用ROSC预处理数据,可以减少模型复杂度和预测误差,从而改进偏最小二乘的回归模型。关键词:定量构效关系研究;变量选择;目标函数;粒子群优化算法;蚁群优化算法;神经网络;进化算法
论文目录:
摘要
Abstract
第1章 绪论
1. 1 定量结构活性相关性研究
1. 2 遗传算法
1. 3 粒子群优化算法
1. 4 蚁群优化算法
1. 5 人工神经网络
1. 6 本论文的研究工作
第2章 改进的粒子群优化算法用于多元线性回归和偏最小二乘的变量选择
2. 1 前言
2. 2 理论
2. 2. 1 粒子群优化算法
2. 2. 2 改进的离散粒子群优化算法
2. 2. 3 目标函数
2. 3 血管紧缩素Ⅱ拮抗物数据
2. 4 结果与讨论
2. 4. 1 改进的PSO用于多元线性回归的变量选择和构效关系研究
2. 4. 2 改进的PSO用于偏最小二乘的变量选择和构效关系研究
2. 5 小结
第3章 杂交粒子群算法用于自适应训练多层前向神经网络
3. 1 前言
3. 2 理论
3. 2. 1 粒子群优化算法
3. 2. 2 改进的离散粒子群优化算法
3. 2. 3 多层神经网络
3. 2. 4 杂交的粒子群优化自适应训练神经网络
3. 2. 5 目标函数
3. 3 数据集
3. 3. 1 芳香胺数据集
3. 3. 2 偏端霉素和类偏端霉素衍生物数据
3. 4 结果与讨论
3. 4. 1 芳香胺数据集
3. 4. 2 偏端霉素和类偏端霉素衍生物数据
3. 4. 3 HPSONN算法中参数的选择
3. 5 小结
第4章 粒子群算法最优分配最小生成树用于分段建模
4. 1 前言
4. 2 理论
4. 2. 1 最小生成树算法
4. 2. 2 改进的离散粒子群优化算法
4. 2. 3 粒子群优化分段建模
4. 2. 4 目标函数
4. 3 血管紧缩素Ⅱ拮抗物数据
4. 4 结果与讨论
4. 4. 1 整体数据集的构效关系研究
4. 4. 2 用粒子群优化分段建模进行构效关系研究
4. 5 小结
第5章 改进的蚁群优化算法用于定量构效关系的变量选择
5. 1 前言
5. 2 理论
5. 2. 1 蚁群优化算法
5. 2. 2 改进的蚁群优化算法
5. 2. 3 目标函数
5. 3 环氧酶抑制活性数据
5. 4 结果与讨论
5. 5 小结
第6章 基于修正Cp统计量作目标函数的进化算法对多元线性回归和偏最小二乘的变量选择
6. 1 前言
6. 2 修正的Cp统计量用于变量选择的QSAR研究
6. 2. 1 修正的Cp统计量用于MLR中的变量选择
6. 2. 2 修正的Cp统计量用于PLS中的变量选择
6. 2. 3 用修正Cp统计量作目标函数的进化算法对MLR和PLS进行变量选择
6. 3 芳香胺数据集
6. 4 结果与讨论
6. 4. 1 基于修正Cp统计量的变量选择的MLR研究
6. 4. 2 基于修正的Cp统计量的变量选择的PLS方法
6. 4. 3 用QSAR模型预测致癌活性
6. 5 小结
第7章 酪氨酸激酶抑制剂的定量结构-活性相关性研究
7. 1 前言
7. 2 数据集和方法
7. 2. 1 数据集
7. 2. 2 描述变量
7. 2. 3 方法
7. 3 结果与讨论
7. 3. 1 一些描述变量的定义
7. 3. 2 修正的Cp统计量
7. 3. 3 1-苯基苯并咪唑类化合物的QSAR模拟
7. 3. 4 PDGFR抑制剂的主成分分析
7. 4 小结
第8章 岭正交信号校正的数据预处理方法用于偏最小二乘模拟
8. 1 前言
8. 2 理论
8. 2. 1 正交信号校正
8. 2. 2 岭正交信号校正
8. 2. 3 广义交互检验用于确定n和λ
8. 3 COX-2抑制剂数据
8. 4 结果与讨论
8. 4. 1 无预处理数据的偏最小二乘模拟的构效关系研究
8. 4. 2 ROSC预处理数据的偏最小二乘模拟的构效关系研究
8. 5 小结
结论
参考文献
致谢
附录A (攻读学位期间所发表的学术论文目录)
发布时间: 2005-04-04
参考文献
- [1].分析化学多维数据解析的化学计量学新算法[D]. 王志国.湖南大学2005
- [2].多变量图像解析与定量结构活性相关性研究的化学计量学新算法[D]. 林伟琦.湖南大学2006
- [3].化学计量学基础算法研究[D]. 许青松.湖南大学2001
- [4].基于混沌的化学计量学新算法研究及基于量子化学计算的构效关系研究[D]. 吕庆章.湖南大学2003
- [5].多维光谱数据解析的化学计量学算法及应用研究[D]. 韩清娟.湖南大学2008
- [6].复杂体系光谱定量分析的新型化学计量学模型与方法研究[D]. 金竞文.湖南大学2014
- [7].化学计量学算法实现的软件开发基础研究[D]. 张志敏.中南大学2012
- [8].化学计量学辅助高阶仪器用于复杂体系目标和非目标分析[D]. 刘志.湖南大学2017
- [9].化学计量学二阶校正方法若干基础理论与应用研究[D]. 李勇.湖南大学2015
- [10].应用于核磁共振波谱数据化学计量学分析的若干数值方法研究[D]. 徐恺频.华东师范大学2014
相关论文
- [1].化学计量学基础算法研究[D]. 许青松.湖南大学2001
- [2].化学数据挖掘新算法和定量构性关系基础研究[D]. 杜一平.湖南大学2002
- [3].基于混沌的化学计量学新算法研究及基于量子化学计算的构效关系研究[D]. 吕庆章.湖南大学2003
- [4].复杂化学数据的知识发现新型化学计量学算法研究[D]. 纳赛尔 阿里 穆罕默德 巴拉卡特.湖南大学2005
- [5].变量选择方法及其在量化的构效关系(QSPR)中的应用[D]. 彭小令.四川大学2005
- [6].分析化学多维数据解析的化学计量学新算法[D]. 王志国.湖南大学2005
- [7].QSAR研究在生命分析化学和环境化学中的应用[D]. 赵春燕.兰州大学2006
- [8].天然产物分子结构和原子结构参数表征及其QSPR/QSAR研究[D]. 聂长明.中南林业科技大学2006
- [9].多变量图像解析与定量结构活性相关性研究的化学计量学新算法[D]. 林伟琦.湖南大学2006
- [10].多元校正与定量结构活性相关性研究中新型化学计量学算法研究[D]. 周燕平.湖南大学2007
标签:定量构效关系研究论文; 变量选择论文; 目标函数论文; 粒子群优化算法论文; 蚁群优化算法论文; 神经网络论文; 进化算法论文;