支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究

支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究

论文摘要

定量结构-性质/活性相关(QSPR/QSAR)研究是计算化学和化学信息学研究中的重要研究热点之一。它主要应用各种统计学方法和理论计算方法研究有机化合物的结构与其各种物理化学性质以及生物活性之间的定量关系。QSPR/QSAR的研究对象包括化合物的各种物理化学性质、生物活性、毒性、药物的各种代谢动力学参数等等,研究领域涉及化学、化工、环境化学、药物化学等诸多学科。 建立准确的定量数学模型一直是QSPR/QSAR研究的追求目标之一,而建模方法又是决定模型好坏的一个关键因素,因此新方法的发展一直是QSPR/QSAR研究中的一个重要任务。本论文在研究小组过去10余年来对神经网络方法(ANN),包括BP网络和RBFNN网络的研究基础上,将支持向量机(SVM)方法应用到化学、环境化学和药物化学等领域中,进行了1100多种化学物质的性质、环境毒物的毒性和药物有关的性质的预测,建立了准确的定量结构性质/活性关系模型。 论文第一章简述了定量结构性质/活性关系(QSPR/QSAR)的基本原理,研究过程以及研究现状,其中在研究过程中着重介绍了建模方法。在指出当前神经网络建模方法不足的基础上,详细介绍了一种新的机器学习算法—支持向量机方法,并概括和展望了其在QSPR/QSAR中的应用。 在第二章中,我们将SVM和RBFNN方法应用到化学领域中,主要包括以下几个方面的研究工作: (1)应用多元线性回归(MLR)和SVM方法建立了预测364个有机化合物的范德华常数的QSPR模型。MLR不仅用来建立线性回归模型,同时也作为选择SVM输入描述符的方法。SVM模型的训练集、交互检验集、测试集和整个数据集的均方误差(Mean Square Error,MSE)分别为:常数a:5.96,8.00,6.67和6.65;常数b:9.56×10-5,3.18×10-4,4.22×10-4和2.33×10-4。 (2)应用启发式(HM)和SVM方法分别建立了149个易挥发有机化合物的气相色谱保留时间和5个分子描述符之间的线性和非线性QSRR模型。非线性的SVM模型的结果优于线性HM模型的结果,对于测试集均方误差MSE分别为1.094和1.644。而且预测值与实验值是非常一致的。 (3)用HM和RBFNN方法建立了预测63个有机小分子化合物在低密度聚乙烯上的渗透系数的定量模型。它建立的模型与以往的模型相比,有同样的可靠性。这

论文目录

  • 摘要
  • ABSTRACT
  • 本论文创新之处
  • 第一章 定量结构一性质/活性关系的基本理论及研究进展
  • 1.1 定量结构一性质/活性关系的概述
  • 1.2 QSPR/QSAR研究过程描述
  • 1.2.1 QSPR/QSAR研究中的主要结构特征
  • 1.2.1.1 经验描述符
  • 1.2.1.2 理论计算描述符
  • 1.2.1.3 其它描述符
  • 1.2.2 QSPR/QSAR研究中描述符选择方法
  • 1.2.3 QSPR/QSAR研究中的建模方法
  • 1.2.3.1 线性方法
  • 1.2.3.2 非线性方法
  • 1.2.3.2.1 人工神经网络(ANN)
  • 1.2.3.2.2 支持向量机算法(SVM)
  • 1.2.4 模型的评价
  • 1.2.4.1 模型的稳定性和可靠性
  • 1.2.4.2 模型的预测能力
  • 1.3 定量结构—性质/活性关系的研究进展
  • 参考文献
  • 第二章 支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学中的应用研究
  • 2.1 基于支持向量机方法的预测范德华常数的QSPR研究
  • 2.1.1 引言
  • 2.1.2 实验部分
  • 2.1.2.1 数据准备
  • 2.1.2.2 分子描述符的产生
  • 2.1.3 方法
  • 2.1.3.1 多元线性回归
  • 2.1.3.2 支持向量机
  • 2.1.3.3 SVM的计算执行环境
  • 2.1.4 结果和讨论
  • 2.1.5 结论
  • 2.2 用启发式(HM)和支持向量机(SVM)方法预测多种易挥发有机化合物的保留时间
  • 2.2.1 引言
  • 2.2.2 数据准备
  • 2.2.2.1 数据集
  • 2.2.2.2 分子描述符的产生
  • 2.2.3 方法
  • 2.2.4 结果和讨论
  • 2.2.4.1 HM方法的结果
  • 2.2.4.2 SVM的结果
  • 2.2.5 结论
  • 2.3 基于HM和RBFNN的低密聚乙烯的渗透系数的QSPR研究
  • 2.3.1 引言
  • 2.3.2 数据集的准备
  • 2.3.2.1 数据集
  • 2.3.2.2 分子描述符的产生
  • 2.3.2.3 分子多样性验证
  • 2.3.3 原理
  • 2.3.4 结果和讨论
  • 2.3.4.1 HM的结果
  • 2.3.4.2 RBFNNs的结果
  • 2.3.4.3 输入参数的讨论
  • 2.3.5.结论
  • 参考文献
  • 第三章 支持向量机(SVM)和径向基神经网络(RBFNN)方法在环境化学中的应用研究
  • 3.1 基于支持向量机(SVM)和线性判别分析(LDA)方法对N-亚硝基化合物致癌性分类研究
  • 3.1.1 引言
  • 3.1.2 数据集和分子描述符的产生
  • 3.1.2.1 数据集
  • 3.1.2.2 分子描述符的产生
  • 3.1.3 方法
  • 3.1.3.1 LDA方法
  • 3.1.3.2 SVM理论
  • 3.1.3.3 SVM的计算执行环境
  • 3.1.4. 结果与讨论
  • 3.1.4.1 LDA的结果
  • 3.1.4.2 SVM模型的结果
  • 3.1.5 结论
  • 3.2 用SVM和HM方法对多氯二联苯二噁英、多氯二联苯呋喃、多氯联苯的QSAR研究
  • 3.2.1 引言
  • 3.2.2 数据集和分子描述符的产生
  • 3.2.2.1 数据集
  • 3.2.2.2 描述符的产生
  • 3.2.3.方法
  • 3.2.4 结果和讨论
  • 3.2.4.1 HM方法的结果
  • 3.2.4.2 SVM模型的结果
  • 3.2.3.4 输入描述符的讨论
  • 3.2.5 结论
  • 3.3 易挥发有机化合物的感官刺激性(LOGRD50)的QSAR研究
  • 3.3.1 引言
  • 3.3.2 实验部分
  • 3.3.2.1 数据组成
  • 3.3.2.3 数据预处理
  • 3.3.3 方法
  • 3.3.4 结果和讨论
  • 3.3.4.1 分类模型的结果
  • 3.3.4.1.1 LDA模型的结果
  • 3.3.4.1.2 SVM模型的结果
  • 3.3.4.1.3 输入判别特征的讨论
  • 3.3.4.2 回归模型的结果
  • 3.3.4.2.1 HM模型的结果
  • 3.3.4.2.2 SVM模型的结果
  • 3.3.4.2.3 RBFNN模型的结果
  • 3.3.4.2.4 输入参数的讨论
  • 3.3.5 结论
  • 3.4 启发式多元线性回归方法用于挥发性有机化合物在大鼠血液和空气中分配系数的定量构效关系研究
  • 3.4.1 引言
  • 3.4.2 实验部分
  • 3.4.2.1 数据集
  • 3.4.2.2 描述符的计算
  • 3.4.3 方法——启发式回归方法
  • 3.4.4 结果与讨论
  • 3.4.4.1 模型的建立
  • 3.3.4.2 参数的讨论
  • 3.4.4.3 模型的交互验证
  • 3.4.5 结论
  • 参考文献
  • 第四章 支持向量机(SVM)和径向基神经网络(RBFNN)方法在药物化学中的应用研究
  • A值'>4.1 用RBFNN和HM方法预测中性和碱性药物的PKA
  • 4.1.1 引言
  • 4.1.2 数据集和分子描述符的产生
  • 4.1.2.1 数据集
  • 4.1.2.2 分子描述符的产生
  • 4.1.3 方法
  • 4.1.4 结果和讨论
  • 4.1.4.1 HM方法的结果
  • 4.1.4.2 RBFNN的结果
  • 4.1.4.3 输入描述符的讨论
  • 4.1.5 结论
  • 4.2 用SVM和HM方法预测多肽阴离子从水相到硝基苯相的吉布斯自由能
  • 4.2.1 引言
  • 4.2.2 实验部分
  • 4.2.2.1 数据集
  • 4.2.2.2 分子多样性分析
  • 4.2.2.3 分子描述符的产生
  • 4.2.3 方法
  • 4.2.4 结果和讨论
  • 4.2.4.1 HM模型的结果
  • 4.2.4.2 SVM和RBFNN模型的结果
  • 4.2.4.3 输入描述符的讨论
  • 4.2.5 结论
  • 参考文献
  • 附录Ⅰ 在读博士学位期间发表论文目录
  • 附录Ⅱ 作者简介
  • 致谢
  • 相关论文文献

    • [1].基于在线学习RBFNN的网络安全态势预测技术研究[J]. 信息网络安全 2016(04)
    • [2].基于改进RBFNN算法的瓦斯传感器非线性校正[J]. 压电与声光 2012(01)
    • [3].基于复合RBFNN的数字温度传感器误差补偿方法[J]. 传感技术学报 2011(02)
    • [4].称重传感器非线性误差的RBFNN补偿[J]. 仪表技术与传感器 2010(06)
    • [5].护卫舰横摇稳定舵的H∞/H2控制器的设计和比较(英文)[J]. Journal of Marine Science and Application 2019(04)
    • [6].基于马尔科夫链修正的RBFNN模型在碾压混凝土重力坝变形预报中的应用[J]. 水电能源科学 2014(10)
    • [7].基于RBFNN的水泥预分解窑主元分析与建模[J]. 滁州学院学报 2011(05)
    • [8].RBFNN在关节空间中的轨迹规划研究[J]. 机床与液压 2008(04)
    • [9].基于改进PSO-RBFNN的海洋蛋白酶发酵过程软测量[J]. 化工学报 2018(03)
    • [10].基于RBFNN的高压断路器机械故障诊断系统[J]. 中国电力 2010(05)
    • [11].一种基于RBFNN的变体飞机高精度自适应反步控制方法[J]. 西北工业大学学报 2020(03)
    • [12].基于二分搜索密度峰算法的RBFNN在月降水预报中的应用[J]. 计算机应用研究 2019(02)
    • [13].基于合作型协同进化的RBFNN分类算法[J]. 模式识别与人工智能 2008(01)
    • [14].以AHP-RBFNN评估建筑工程项目的风险[J]. 安全 2018(01)
    • [15].基于RBFNN的专利自动分类研究[J]. 现代图书情报技术 2011(12)
    • [16].改进的RBFNN学习算法及其应用[J]. 微计算机信息 2009(15)
    • [17].基于自适应RBFNN噪声估计的自抗扰控制在姿态控制中的应用[J]. 机器人 2019(01)
    • [18].基于组合训练方法的RBFNN转炉炼钢静态模型[J]. 杭州电子科技大学学报 2011(03)
    • [19].基于RBFNN的卫星地面站系统建模方法[J]. 计算机仿真 2009(03)
    • [20].Modeling and Robust Backstepping Sliding Mode Control with Adaptive RBFNN for a Novel Coaxial Eight-rotor UAV[J]. IEEE/CAA Journal of Automatica Sinica 2015(01)
    • [21].结合MPGA-RBFNN的一般机器人逆运动学求解[J]. 智能系统学报 2019(01)
    • [22].核k均值RBFNN的煤与瓦斯突出预测研究[J]. 计算机与数字工程 2011(07)
    • [23].地面站数传系统的RBFNN模型及算法[J]. 系统工程与电子技术 2010(09)
    • [24].一种基于改进的密度法确定RBFNN的数据中心的算法[J]. 微型电脑应用 2009(04)
    • [25].An elasto-plastic constitutive model of moderate sandy clay based on BC-RBFNN[J]. Journal of Central South University of Technology 2008(S1)
    • [26].一种基于改进的密度法确定RBFNN的数据中心的算法[J]. 微计算机应用 2009(01)
    • [27].基于改进RBFNN的配电网停电时间自动识别模型[J]. 电力系统及其自动化学报 2016(S1)
    • [28].An ICPSO-RBFNN nonlinear inversion for electrical resistivity imaging[J]. Journal of Central South University 2016(08)
    • [29].建筑工程质量成本RBFNN预测模型[J]. 资源开发与市场 2015(01)
    • [30].基于RBFNN的称重传感器温度误差补偿[J]. 传感器与微系统 2011(06)

    标签:;  ;  ;  ;  ;  ;  

    支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究
    下载Doc文档

    猜你喜欢