论文摘要
药物的药代动力学特征,即药物的吸收、分布、代谢和排泄(ADME),再加上毒性(Toxicity)是决定一个药物能否成功上市的关键因素。传统的药物设计中对ADME/T性质的重视不够,导致研制的候选药物能成功上市的几率仅为1/10,甚至更少。因此在药物研发之初就考虑ADME/T性质将会有助于降低药物的淘汰率,从而节约药物开发成本。由于ADME/T的高通量实验测定难以实现,ADME/T性质预测的计算机模拟,便成为一条值得探索的重要途径。目前已有多种方法用于计算机辅助ADME/T性质预测,包括定量的结构一活性关系(QSAR)和定量的结构—性质关系(QSPR)等。近年由于支持向量机(SVM)方法在解决小样本,非线性及高维模式识别问题中表现出许多特有的优势,因而SVM在许多领域得到广泛应用。本文使用SVM结合遗传算法(GA)来对药物的ADME/T性质进行研究。研究表明,GA是一种高效的消除冗余变量、提高模型计算效率的变量筛选方法。同时,本方法对ADME/T性质的预测结果,优于他人的研究结果。说明结合遗传算法的SVM方法在ADME/T性质预测中是一种更有效的分类方法。具体内容如下:第一章,介绍了SVM的理论基础、用C语言编写的网格搜索算法程序确定核函数的两个重要参数C和γ的具体实现步骤、分子描述符的分类和计算方法以及使用遗传算法(GA)进行变量选择的原理和参数的设置。第二章,检验SVM结合GA的方法对P-gp底物的预测能力。使用与文献中同样的化合物数据集和分子描述符,用C语言编写的GA程序对分子描述符进行筛选。在模型训练过程中用网格搜索法确定核函数的两个重要参数C和γ,同时用5重交叉验证对模型进行验证。把SVM结合GA方法建立的P-gp底物预测模型,与文献中使用的SVM结合递归变量消除(RFE)方法建立的模型进行对比。结果表明,我们使用SVM结合GA方法建立的P-gp底物预测模型,不仅可以提高预测正确率,而且可以进一步减少变量个数,从而提高模型预测的速度。第三章用SVM结合GA的方法建立药物透血脑屏障(BBB)的预测模型,与文献中使用的几种统计学方法建立的模型进行对比。分子描述符经遗传算法筛选后,由按文献选定的37个减少到了17个,建立的SVM模型的总体预测正确率高于文献值。第四、五章是在第二、三章研究手段的基础上,对尚未用SVM方法进行研究的药物与人血清白蛋白(HSA)结合和药物致癌性的两个体系进行了分类预测。总体预测正确率都在80.0%以上。
论文目录
相关论文文献
标签:支持向量机论文; 分子描述符论文; 遗传算法论文; 糖蛋白底物论文; 人血清白蛋白论文; 透血脑屏障论文; 致癌性论文;