PLS和GA应用于部分有机污染物的QSAR研究

PLS和GA应用于部分有机污染物的QSAR研究

论文摘要

有机污染物定量结构-活性相关(QSAR)对于有机化合物的生态风险性评价、污染控制和预防等具有重要意义。QSAR研究常采用偏最小二乘回归分析(PLS)建立模型,以解决大量分子结构描述符的使用带来的变量间多重共线性问题。为了对众多的分子结构描述符进行筛选以得到最佳的QSAR模型,人们提出了各种变量选择方法。其中,基于遗传算法(GA)的变量选择方法由于结合了GA较强的全局优化搜索能力而具有较好的效果。但是,现有的各种变量选择方法均存在着一定的问题。 本文针对两个典型的不同样本容量的有机污染物QSAR研究,提出了不同的变量选择方法,就其变量选择及模型优化效果进行了深入地研究和探讨,在此基础之上建立了最佳的OSAR模型,并对所得的模型进行了相应的解释。 1.基于量子化学分子结构描述符和拓扑参数,应用PLS,建立了可以预测不同环境温度下多氯代二苯并二噁(口英)/呋喃(PCDD/Fs)固相蒸气压(Ps)和过冷液相蒸气压(PL)的定量模型。 在建模过程中,提出并采用了三种适用于大样本QSAR研究的变量选择方法:①基于逐步回归分析的变量选择方法;②基于变量投影重要性参数VIP的变量选择方法;③基于PLS模型的Qcum2(经交叉验证得到的,模型中提取的PLS成分所能解释的因变量的累计方差的比例)和VIP的变量选择方法。研究发现:由于预测变量间多重共线性的影响,第一种方法的性能不稳定,不能得到较好的模型;第二种方法所依据的VIP并不是一个优良的搜索方向的判据,而且该方法的搜索范围较小,因此这种方法得到的模型常是局部最优解;第三种方法以Qcum2作为搜索方向的主要判据,而且其搜索范围较广,因此这种方法常常能得到较好的模型,是这三种方法中最好的变量选择方法。 在PCDD/Fs的蒸气压(P)的QSAR模型中加入了对熵因素的考察。研究结果表明:熵因素是影响PCDD/Fs的Ps的一个重要因素,而对PCDD/Fs的PL没有重要影响。 建立的PCDD/Fs的尸s和PL的温度依附性预测模型的Qcum2均高于0.970,表明模型具有较好的稳健性和预测能力,可以用于PCDD/Fs不同温度下P的预测。对所得的最佳模型的考察发现:影响PCDD/Fs的Ps的主要因素,按由强到弱的顺序,依次是温度、分子间色散力、熵因素、分子间的偶极-偶极作用力和偶极-诱导偶极作用力;影响PCDD/Fs的PL的主要因素是温度和分子间色散力。 2.基于正辛醇/水分配系数(Kow)和一些理论分子结构描述符,应用PLS,建立了光合作用(PHS)抑制剂和乙酰乳酸合成酶(ALS)抑制剂两类除草剂对小球藻(Chtorella Vulgaris)急性毒性的QSARs。

论文目录

  • 摘要
  • Abstract
  • 1 有机污染物定量结构-活性相关的研究进展
  • 1.1 有机污染物定量结构-活性相关
  • 1.1.1 有机污染物QSAR的含义和意义
  • 1.1.2 QSAR的发展和前景
  • 1.1.3 QSAR研究的主要方法和模型
  • 1.1.4 有机污染物QSAR研究的基本步骤
  • 1.1.5 有机污染物QSAR研究常用的分子结构描述符
  • 1.1.6 有机污染物QSAR研究常用的建模方法
  • 1.2 偏最小二乘回归分析(PLS)
  • 1.2.1 PLS的基本原理
  • 1.2.2 PLS的一个简化算法
  • 1.2.3 PLS成分数目的确定
  • 1.2.4 PLS方法的特点
  • 1.3 变量选择
  • 1.3.1 传统的变量选择法
  • 1.3.2 基于PLS的变量选择法
  • 1.3.3 基于搜索算法的变量选择法
  • 1.4 本论文的研究工作
  • s)蒸气压的QSAR研究'>2 PLS应用于多氯代二苯并二噁(口英)/呋喃(PCDD/Fs)蒸气压的QSAR研究
  • 2.1 前言
  • s简介'>2.1.1 PCDD/Fs简介
  • s的蒸气压'>2.1.2 PCDD/Fs的蒸气压
  • 2.1.3 蒸气压的预测方法
  • 2.1.4 本章的研究工作
  • 2.2 建模数据及研究方法
  • s的蒸气压数据'>2.2.1 PCDD/Fs的蒸气压数据
  • 2.2.2 分子结构描述符和温度变量
  • 2.2.3 建模方法
  • 2.3 结果与讨论
  • s的Ps的预测模型'>2.3.1 PCDD/Fs的Ps的预测模型
  • s的PL的预测模型'>2.3.2 PCDD/Fs的PL的预测模型
  • 2.4 小结
  • 3 PLS应用于部分除草剂对Chlorella Vulgaris急性毒性的QSAR研究
  • 3.1 前言
  • 3.2 建模数据及研究方法
  • 3.2.1 急性毒性数据
  • 3.2.2 分子结构描述符
  • 3.2.3 建模方法
  • 3.3 结果与讨论
  • 3.3.1 模型的建立与比较
  • 3.3.2 毒性作用机理的解释
  • 3.4 小结
  • 4 GA-PLS算法的改进及其在部分有机污染物QSAR研究中的应用
  • 4.1 GA-PLS算法简介
  • 4.1.1 遗传算法
  • 4.1.2 GA-PLS算法的基本过程
  • 4.2 GA-PLS算法中适应度函数的改进及算法的实现
  • 4.2.1 GA-PLS算法中适应度函数的改进
  • 4.2.2 GA-PLS算法的实现
  • s蒸气压的QSAR研究'>4.3 GA-PLS应用于PCDD/Fs蒸气压的QSAR研究
  • s固相蒸气压的预测模型'>4.3.1 PCDD/Fs固相蒸气压的预测模型
  • s过冷液相蒸气压的预测模型'>4.3.2 PCDD/Fs过冷液相蒸气压的预测模型
  • 4.4 GA-PLS应用于部分除草剂对Chlorella Vulgaris急性毒性的QSAR研究
  • 4.4.1 PHS抑制剂对Chlorella Vulgaris急性毒性的QSAR
  • 4.4.2 ALS抑制剂对Chlorella Vulgaris急性毒性的QSAR
  • 4.5 小结
  • 5 结论、创新点与展望
  • 5.1 结论
  • 5.2 创新点
  • 5.3 展望
  • 参考文献
  • 攻读博士学位期间发表学术论文情况
  • 附录A 改进的GA-PLS算法的源程序
  • 致谢
  • 个人简历
  • 大连理工大学学位论文版权使用授权书
  • 相关论文文献

    • [1].用于正电子发射断层显像的~(68)Ga双功能螯合剂的研究进展[J]. 化学试剂 2020(10)
    • [2].老年评分系统(GA)在老年多发性骨髓瘤患者中的应用研究进展[J]. 实用临床护理学电子杂志 2018(19)
    • [3].GA处理下咖啡黄葵种子萌发及与α-淀粉酶相关性研究[J]. 种子 2017(03)
    • [4].电感耦合等离子体原子发射光谱法测定高纯铝中Ga[J]. 化学工程与装备 2017(05)
    • [5].基于改进GA的云计算任务调度算法研究[J]. 电脑知识与技术 2016(13)
    • [6].GA对彩色马蹄莲生长影响研究[J]. 安徽农学通报 2015(11)
    • [7].~(68)Ga标记放射性药物的制备及应用研究进展[J]. 同位素 2017(03)
    • [8].基于最大类间方差法与GA相结合的图像分割算法研究[J]. 辽宁工业大学学报(自然科学版) 2016(02)
    • [9].基于改进GA的四杆机构优化分析[J]. 榆林学院学报 2016(06)
    • [10].GA-凸函数的一个充要条件[J]. 高等数学研究 2012(04)
    • [11].GA对平贝母休眠鳞茎分化的影响[J]. 北方园艺 2011(17)
    • [12].关于GA—凸函数的一些性质[J]. 内蒙古民族大学学报(自然科学版) 2010(02)
    • [13].基于GA的电子侦察卫星任务规划问题研究[J]. 计算机仿真 2009(08)
    • [14].~(67)Ga显像在结外淋巴瘤诊治中的应用[J]. 上海交通大学学报(医学版) 2008(04)
    • [15].扬子陆块~2.0 Ga的区域变质事件对南北黄陵古元古代差异演化的启示[J]. 中国地质 2020(04)
    • [16].热处理对GA钢和双相钢力学性能的影响[J]. 热加工工艺 2017(16)
    • [17].基于GA的电力系统多目标模糊无功优化[J]. 上海电力学院学报 2014(06)
    • [18].GA鼻内镜下筛前神经阻断加中药熏蒸治疗变应性鼻炎[J]. 当代医学 2013(31)
    • [19].基于GA的汽车故障特征选择[J]. 山东交通科技 2009(06)
    • [20].巴西GA公司烧结机施工中圆筒混合机托辊运转不灵原因分析及排除[J]. 烧结球团 2008(06)
    • [21].二进制编码GA基因种群多样性数学模型研究[J]. 软件导刊 2015(11)
    • [22].新型访问域部分重叠的多旅行商问题的GA求解[J]. 中南大学学报(自然科学版) 2013(S1)
    • [23].与GA-凸函数有关的两个函数[J]. 数学的实践与认识 2012(10)
    • [24].基于GA的颗粒复合材料细观胞元重构研究[J]. 计算机应用研究 2012(10)
    • [25].血中GA、MCP-1和超敏C反应蛋白对急性冠脉综合征患者的影响[J]. 中外医学研究 2011(11)
    • [26].基于GA-模糊可靠度的采场结构参数优化设计[J]. 武汉理工大学学报 2010(09)
    • [27].GA对扁竹蓼硬枝和嫩枝水插繁殖的影响[J]. 河南农业科学 2010(04)
    • [28].GA优化神经网络思想[J]. 软件导刊 2009(10)
    • [29].基于GA算法的柔性抛光工业机器人最优轨迹规划[J]. 组合机床与自动化加工技术 2020(06)
    • [30].18α-GA通过上调蛋白酶体活性促进晚期骨髓间充质干细胞增殖[J]. 中国病理生理杂志 2015(12)

    标签:;  ;  ;  ;  ;  

    PLS和GA应用于部分有机污染物的QSAR研究
    下载Doc文档

    猜你喜欢