基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究

基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究

论文摘要

人工智能的发展对科技和经济的发展起了重大的推动作用。尤其在解决复杂优化、减少反应时间和促进产品的开发等方面表现更为突出。随着科技的进步,大量数据的产生需要有效的方法才能得出更加可行的结果,有利于促进科技的快速发展。因此研究新的高效数据挖掘方法和寻找规律已成为人工智能研究的迫切需要。 本文对一种新的数据挖掘方法:基因表达式编程(gene expression programming,GEP)进行研究,GEP是一种新的机器学习算法,具有优异的泛化能力,是由Ferreira C.于1999年根据遗传算法和遗传程序发展而来的。本论文主要对GEP的原理和在定量结构—性质/活性关系(QSPR/QSAR)和疾病诊断方面的进行了应用研究。 第一章:对GEP算法原理、实现步骤以及研究现状进行了详细的综述,并对GEP和支持向量机(support vector machines,SVM)在疾病诊断和QSAR中的应用现状进行了综述。 第二章:应用GEP和SVM方法对疾病的诊断和发病率进行预测,包括:(1)用SVM方法对346例(冠心病172例,健康体检174例)进行了分类判别,同时用线性判别分析方法(linear discriminant analysis,LDA)作为对照研究,对训练集的预测准确率分别是96.86%和78.18%,测试组的预测准确率分别是90.57%和72.73%;(2)用SVM和LDA算法对70例(肾病综合征50例,肾小球肾炎20例)进行了诊断,训练集的预测准确率分别是94.6%和89.86%,测试组的预测准确率分别是78.18%和72.73%。表明用SVM方法建立的模型其预测能力要优于LDA;(3)用GEP方法对2003年我国SARS的高发地区北京市和山西省的发病趋势进行建模预测,其拟合情况与当时SRAS实际发病和死亡情况基本一致,实验结果表明其在精度和速度上都优于神经网络算法。 第三章:GEP和SVM方法在药物性质方面的应用研究:(1)应用启发式方法(HM)和支持向量机方法建立了70种药物与血浆蛋白结合率的定量构效关系模型,研究了分子结构对药物与血浆蛋白结合率的影响。两种方法均得到了较好的结果,交互检验的相关系数平方(R~2)分别为0.80和0.82;通过对模型的稳

论文目录

  • 摘要
  • Abstract
  • 论文创新之处
  • 第一章 基因表达编程算法和支持向量机方法基本原理及其应用进展
  • 1.1.引言
  • 1.1.1 数据挖掘
  • 1.1.2 决定树
  • 1.1.3 噪声和过拟合
  • 1.2 遗传算法(GA)
  • 1.2.1 GA中最常用的算子有如下几种
  • 1.2.2 遗传算法的特点
  • 1.2.3 遗传算法的基本步骤
  • 1.2.4 遗传算法的研究历史与现状
  • 1.3 遗传程序设计
  • 1.3.1 进化策略
  • 1.3.2 进化规划
  • 1.4 基因表达式程序设计
  • 1.4.1 GEP的优势
  • 1.4.2 基因组
  • 1.4.3 开放阅读框架(ORF)和基因
  • 1.4.4 基因表达式编程方法实现过程
  • 1.4.5 适应度函数选择
  • 1.4.6 经典GEP算法流程图
  • 1.4.7 目前GEP算法的应用领域
  • 1.5 多元线性回归(MLR)
  • 1.6 主成分回归(PCR)
  • 1.7 偏最小二乘法
  • 1.8 逐步判别分析(LDA)
  • 1.9 统计学习理论
  • 1.9.1 Vapnik—Chervonenkis维
  • 1.9.2 结构风险最小化
  • 1.9.3 支持向量机(SVM)
  • 参考文献
  • 第二章 基因表达编程与支持向量机在疾病诊断中的应用研究
  • 2.1 基于SVM的冠心病诊断
  • 2.1.1 引言
  • 2.1.2 方法和材料
  • 2.1.3 参数选择
  • 2.1.4 线性判别分析(LDA)
  • 2.1.5 支持向量机(SVM)
  • 2.1.6 训练集和测试集的选择
  • 2.1.7 结果
  • 2.1.8 讨论
  • 2.1.9 结论
  • 2.2 基于SVM的肾病综合症和肾小球肾炎的分类判断
  • 2.2.1 引言
  • 2.2.2 方法和材料
  • 2.2.3 线性判别分析(LDA)
  • 2.2.4 支持向量机
  • 2.2.5 训练集和测试集的选择
  • 2.2.6 结果
  • 2.2.7 讨论
  • 2.2.8 结论
  • 2.3 改进的GEP(IGEP)在非典型肺炎疫情分析及预测中的应用
  • 2.3.1 研究背景
  • 2.3.2 实验部分
  • 2.3.3 结果与讨论
  • 2.3.4 结论
  • 参考文献
  • 第三章 基于基因表达式编程和支持向量机方法的药物的QSAR研究
  • 3.1 基于启发式方法和支持向量机方法预测药物与人血浆蛋白结合率
  • 3.1.1 引言
  • 3.1.2 研究方法
  • 3.1.3 结果和讨论
  • 3.1.4 结论
  • 3.2 基于基因表达编程的1,4-二氢吡啶钙离子通道拮抗剂的QSAR研究
  • 3.2.1 引言
  • 3.2.2 实验部分
  • 3.2.3 结果与讨论
  • 3.2.4 结论
  • 3.3 基于基因表达式编程的抗艾滋病药物EC50的研究
  • 3.3.1 引言
  • 3.3.2 实验部分
  • 3.3.3 结果与讨论
  • 3.3.4 结论
  • 参考文献
  • 第四章 基因表达式编程和支持向量机方法在化学中的应用研究
  • 4.1 基于支持向量机方法预测α环糊精-苯衍生物包结物稳定常数
  • 4.1.1 引言
  • 4.1.2 实验部分
  • 4.1.3 结果和讨论
  • 4.1.4 结论
  • 4.2 支持向量机方法预测醛类化合物急性毒性研究
  • 4.2.1 引言
  • 4.2.2 实验部分
  • 4.2.3 结果和讨论
  • 4.2.4 结论
  • 4.3 基因表达式编程在分子印迹聚合物中的应用研究
  • 4.3.1 引言
  • 4.3.2 实验部分
  • 4.3.3 结果与讨论
  • 4.3.4 结论
  • 参考文献
  • 附录Ⅰ 在读博士学位期间发表和待发表论文目录
  • 附录Ⅱ 作者简介
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究
    下载Doc文档

    猜你喜欢