基于支持向量机的药物ADME/T性质预测

基于支持向量机的药物ADME/T性质预测

论文摘要

药物的药代动力学特征,即药物的吸收、分布、代谢和排泄(ADME),再加上毒性(Toxicity)是决定一个药物能否成功上市的关键因素。传统的药物设计中对ADME/T性质的重视不够,导致研制的候选药物能成功上市的几率仅为1/10,甚至更少。因此在药物研发之初就考虑ADME/T性质将会有助于降低药物的淘汰率,从而节约药物开发成本。由于ADME/T的高通量实验测定难以实现,ADME/T性质预测的计算机模拟,便成为一条值得探索的重要途径。目前已有多种方法用于计算机辅助ADME/T性质预测,包括定量的结构一活性关系(QSAR)和定量的结构—性质关系(QSPR)等。近年由于支持向量机(SVM)方法在解决小样本,非线性及高维模式识别问题中表现出许多特有的优势,因而SVM在许多领域得到广泛应用。本文使用SVM结合遗传算法(GA)来对药物的ADME/T性质进行研究。研究表明,GA是一种高效的消除冗余变量、提高模型计算效率的变量筛选方法。同时,本方法对ADME/T性质的预测结果,优于他人的研究结果。说明结合遗传算法的SVM方法在ADME/T性质预测中是一种更有效的分类方法。具体内容如下:第一章,介绍了SVM的理论基础、用C语言编写的网格搜索算法程序确定核函数的两个重要参数C和γ的具体实现步骤、分子描述符的分类和计算方法以及使用遗传算法(GA)进行变量选择的原理和参数的设置。第二章,检验SVM结合GA的方法对P-gp底物的预测能力。使用与文献中同样的化合物数据集和分子描述符,用C语言编写的GA程序对分子描述符进行筛选。在模型训练过程中用网格搜索法确定核函数的两个重要参数C和γ,同时用5重交叉验证对模型进行验证。把SVM结合GA方法建立的P-gp底物预测模型,与文献中使用的SVM结合递归变量消除(RFE)方法建立的模型进行对比。结果表明,我们使用SVM结合GA方法建立的P-gp底物预测模型,不仅可以提高预测正确率,而且可以进一步减少变量个数,从而提高模型预测的速度。第三章用SVM结合GA的方法建立药物透血脑屏障(BBB)的预测模型,与文献中使用的几种统计学方法建立的模型进行对比。分子描述符经遗传算法筛选后,由按文献选定的37个减少到了17个,建立的SVM模型的总体预测正确率高于文献值。第四、五章是在第二、三章研究手段的基础上,对尚未用SVM方法进行研究的药物与人血清白蛋白(HSA)结合和药物致癌性的两个体系进行了分类预测。总体预测正确率都在80.0%以上。

论文目录

  • 摘要
  • Abstract
  • 前言
  • 第一章 ADME/T性质预测模型的理论基础
  • 1.1 分子描述符
  • 1.2 变量的选择
  • 1.2.1 变量的预处理
  • 1.2.2 采用遗传算法的变量筛选方法
  • 1.3 参数的标准化处理
  • 1.4 支持向量机
  • 1.4.1 线性可分问题
  • 1.4.2 线性不可分问题
  • 1.5 模型预测结果评价
  • 1.6 模型的验证方法
  • 第二章 p-糖蛋白(P-gp)底物的预测
  • 2.1 P-gp底物和非底物数据的收集
  • 2.2 分子描述符
  • 2.3 SVM模型验证
  • 2.4 结果与讨论
  • 2.4.1 使用GA进行变量筛选
  • 2.4.2 验证SVM模型
  • 2.5 小结
  • 第三章 药物透血脑屏障(blood—brain barrier,BBB)的预测
  • 3.1 BBB+和BBB-药物活性数据
  • 3.2 分子描述符
  • 3.3 结果与讨论
  • 3.3.1 使用GA进行变量筛选
  • 3.3.2 验证SVM模型
  • 3.4 小结
  • 第四章 药物与人血清白蛋白(HSA)结合的预测
  • 4.1 药物与人血清白蛋白(HSA)结合活性数据
  • 4.2 分子描述符
  • 4.3 结果与讨论
  • 4.3.1 使用GA进行变量筛选
  • 4.3.2 验证SVM模型
  • 4.4 小结
  • 第五章 药物致癌性(Carcinogenic activity)的预测
  • 5.1 药物致癌性的数据
  • 5.2 分子描述符
  • 5.3 结果与讨论
  • 5.3.1 使用GA进行变量筛选
  • 5.3.2 验证SVM模型
  • 5.4 小结
  • 第六章 结论
  • 参考文献
  • 研究生期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    基于支持向量机的药物ADME/T性质预测
    下载Doc文档

    猜你喜欢