论文摘要
药物的药代动力学特征和毒性(ADME/T)是决定候选药物能否成功上市的关键因素。传统的药物设计中对ADME/T性质的重视不够,导致候选药物在临床试验阶段失败率极高。因此,在药物研发初期就考虑ADME/T性质将会有助于提高候选药物的成功率,从而减少药物开发的时间和金钱上的浪费。由于ADME/T的高通量实验测定难以实现,使用计算机模拟方法预测化合物的ADME/T性质,便成为一条重要途径。目前已有多种方法用于计算机辅助ADME/T性质预测,包括定量的结构-活性关系(QSAR)或定量的结构-性质关系(QSPR)、反向分子对接、基于分子片段的机器学习算法等。本论文提出了一种全新的分子描述符--生物相关谱(biological relevance spectrum, BRS)表征分子结构,BRS反映了一个化合物在生物相关空间中的分布,与生物活性、毒性等因素相关。我们借助SVM方法分别构建了化合物的人体小肠吸收、血脑屏障透过、亚细胞单位分布、急性毒性和成药性预测模型,对生物相关谱在化合物ADME/T性质预测中的应用进行初步探索。论文主要包括以下几个部分:第一部分BRS用于药物的药代动力学性质预测首先,使用SVM判别分析方法构建了药物的人体小肠吸收、血脑屏障透过的预测模型。两个模型的总体预测准确率分别达到97.96%和97.40%,使用独立测试集对模型的推广能力进行验证,预测准确率分别为93.69%和68.29%。然后,选用Drugbank数据库中定位在细胞核(Nucleus)和细胞周质(Periplasm)这两个亚细胞单位的上市药物,构建了药物的亚细胞分布预测模型,模型对测试集进行预测的总体准确率为81.82%,对训练集进行留一法验证,准确率为87.50%。第二部分BRS用于化合物的毒性预测使用SVM回归分析方法,依据ToxicFinder数据库中化合物的鼠(mouse)经肌肉给药途径(intramuscular)和兔(rabbit)经静脉注射途径(intravenous)这两个不同体系的毒性实验数据,构建了化合物急性毒性预测模型。两个模型对测试集进行预测,决定系数R2分别为0.7110和0.7701。第三部分BRS用于化合物的成药性预测以Drugbank数据库中经FDA批准成功上市的药物为正样本,分别以非药物合成化合物和研究失败的药物做负样本,建立了两个化合物成药性的SVM判别模型,两个模型测试集的总体准确率分别是81.42和75.57%。利用这两个模型分别对MDDR数据库中不同药物开发阶段化合物进行预测的结果均显示,随着药物开发阶段的发展,成药性呈现逐渐升高的趋势,这与实际情况相吻合,表明以生物相关谱做特征向量建立的化合物成药性预测模型有一定的预测能力和推广能力。以上研究表明,利用BRS可以建立具有较高预测能力的吸收、分布、毒性和成药性预测模型,BRS可以作为多元分子描述符用于QSAR等药物设计方法。