论文摘要
人工智能的发展对科技和经济的发展起了重大的推动作用。尤其在解决复杂优化、减少反应时间和促进产品的开发等方面表现更为突出。随着科技的进步,大量数据的产生需要有效的方法才能得出更加可行的结果,有利于促进科技的快速发展。因此研究新的高效数据挖掘方法和寻找规律已成为人工智能研究的迫切需要。 本文对一种新的数据挖掘方法:基因表达式编程(gene expression programming,GEP)进行研究,GEP是一种新的机器学习算法,具有优异的泛化能力,是由Ferreira C.于1999年根据遗传算法和遗传程序发展而来的。本论文主要对GEP的原理和在定量结构—性质/活性关系(QSPR/QSAR)和疾病诊断方面的进行了应用研究。 第一章:对GEP算法原理、实现步骤以及研究现状进行了详细的综述,并对GEP和支持向量机(support vector machines,SVM)在疾病诊断和QSAR中的应用现状进行了综述。 第二章:应用GEP和SVM方法对疾病的诊断和发病率进行预测,包括:(1)用SVM方法对346例(冠心病172例,健康体检174例)进行了分类判别,同时用线性判别分析方法(linear discriminant analysis,LDA)作为对照研究,对训练集的预测准确率分别是96.86%和78.18%,测试组的预测准确率分别是90.57%和72.73%;(2)用SVM和LDA算法对70例(肾病综合征50例,肾小球肾炎20例)进行了诊断,训练集的预测准确率分别是94.6%和89.86%,测试组的预测准确率分别是78.18%和72.73%。表明用SVM方法建立的模型其预测能力要优于LDA;(3)用GEP方法对2003年我国SARS的高发地区北京市和山西省的发病趋势进行建模预测,其拟合情况与当时SRAS实际发病和死亡情况基本一致,实验结果表明其在精度和速度上都优于神经网络算法。 第三章:GEP和SVM方法在药物性质方面的应用研究:(1)应用启发式方法(HM)和支持向量机方法建立了70种药物与血浆蛋白结合率的定量构效关系模型,研究了分子结构对药物与血浆蛋白结合率的影响。两种方法均得到了较好的结果,交互检验的相关系数平方(R~2)分别为0.80和0.82;通过对模型的稳
论文目录
摘要Abstract论文创新之处第一章 基因表达编程算法和支持向量机方法基本原理及其应用进展1.1.引言1.1.1 数据挖掘1.1.2 决定树1.1.3 噪声和过拟合1.2 遗传算法(GA)1.2.1 GA中最常用的算子有如下几种1.2.2 遗传算法的特点1.2.3 遗传算法的基本步骤1.2.4 遗传算法的研究历史与现状1.3 遗传程序设计1.3.1 进化策略1.3.2 进化规划1.4 基因表达式程序设计1.4.1 GEP的优势1.4.2 基因组1.4.3 开放阅读框架(ORF)和基因1.4.4 基因表达式编程方法实现过程1.4.5 适应度函数选择1.4.6 经典GEP算法流程图1.4.7 目前GEP算法的应用领域1.5 多元线性回归(MLR)1.6 主成分回归(PCR)1.7 偏最小二乘法1.8 逐步判别分析(LDA)1.9 统计学习理论1.9.1 Vapnik—Chervonenkis维1.9.2 结构风险最小化1.9.3 支持向量机(SVM)参考文献第二章 基因表达编程与支持向量机在疾病诊断中的应用研究2.1 基于SVM的冠心病诊断2.1.1 引言2.1.2 方法和材料2.1.3 参数选择2.1.4 线性判别分析(LDA)2.1.5 支持向量机(SVM)2.1.6 训练集和测试集的选择2.1.7 结果2.1.8 讨论2.1.9 结论2.2 基于SVM的肾病综合症和肾小球肾炎的分类判断2.2.1 引言2.2.2 方法和材料2.2.3 线性判别分析(LDA)2.2.4 支持向量机2.2.5 训练集和测试集的选择2.2.6 结果2.2.7 讨论2.2.8 结论2.3 改进的GEP(IGEP)在非典型肺炎疫情分析及预测中的应用2.3.1 研究背景2.3.2 实验部分2.3.3 结果与讨论2.3.4 结论参考文献第三章 基于基因表达式编程和支持向量机方法的药物的QSAR研究3.1 基于启发式方法和支持向量机方法预测药物与人血浆蛋白结合率3.1.1 引言3.1.2 研究方法3.1.3 结果和讨论3.1.4 结论3.2 基于基因表达编程的1,4-二氢吡啶钙离子通道拮抗剂的QSAR研究3.2.1 引言3.2.2 实验部分3.2.3 结果与讨论3.2.4 结论3.3 基于基因表达式编程的抗艾滋病药物EC50的研究3.3.1 引言3.3.2 实验部分3.3.3 结果与讨论3.3.4 结论参考文献第四章 基因表达式编程和支持向量机方法在化学中的应用研究4.1 基于支持向量机方法预测α环糊精-苯衍生物包结物稳定常数4.1.1 引言4.1.2 实验部分4.1.3 结果和讨论4.1.4 结论4.2 支持向量机方法预测醛类化合物急性毒性研究4.2.1 引言4.2.2 实验部分4.2.3 结果和讨论4.2.4 结论4.3 基因表达式编程在分子印迹聚合物中的应用研究4.3.1 引言4.3.2 实验部分4.3.3 结果与讨论4.3.4 结论参考文献附录Ⅰ 在读博士学位期间发表和待发表论文目录附录Ⅱ 作者简介致谢
相关论文文献
标签:化学信息学论文; 定量结构性质论文; 活性关系论文; 基因表达式编程论文; 支持向量机论文; 疾病诊断论文; 药物设计论文;
基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究
下载Doc文档