论文摘要
随着后基因时代的到来,蛋白质组学研究正成为生命科学中一个重要的研究领域。在目前的蛋白质组学研究中,蛋白质二级结构预测仍然是一项长期的历史任务和挑战。这一领域的任何新突破,都将有助于更好地理解蛋白质功能、人类健康和疾病的细胞组成结构,对医药、农业和生物科技等应用领域也有着及其重要的指导意义。本文应用生物信息学中有关蛋白质结构及其预测的理论,结合数据挖掘的方法技术,对蛋白质二级结构预测的相关问题进行了深入细致研究。分析研究工作主要包括以下两个方面。第一,从分析研究当前生物信息学中蛋白质二级结构预测领域的理论知识及研究发展现状入手,找出现阶段进行蛋白质二级结构预测所面临的困难,确定本文的研究方向。第二,按照氨基酸的亲-疏水性质,结合从目前蛋白质数据库提取出的极具代表性已知数据,建立起有效的数学模型;通过对关联规则、遗传算法、模拟退火等数据挖掘方法技术的研究与分析比较,利用简单遗传算法结合关联规则的数据挖掘技术,来实现基于简单遗传算法的模式规则挖掘,并在此基础之上完成蛋白质二级结构的预测。同时,本文将模拟退火遗传算法引入到蛋白质二级结构预测的模式规则挖掘中来,以克服简单遗传算法存在最为严重的“过早收敛”问题和模拟退火收敛速度慢和易陷入局部收敛的缺陷。最后,设计实验对在蛋白质二级结构预测中,采用的基于简单遗传算法的模式规则挖掘策略和基于模拟退火遗传算法的模式规则挖掘策略进行分析比较,验证算法改进的有效性和正确性。
论文目录
摘要Abstract第1章 绪论1.1 课题的研究背景及意义1.1.1 课题的研究背景1.1.2 课题的研究意义1.2 蛋白质二级结构的研究发展现状1.2.1 蛋白质二级结构预测的发展过程1.2.2 国内外研究发展现状1.2.3 面临的困难与挑战1.3 本文的组织结构第2章 蛋白质与蛋白质二级结构预测2.1 蛋白质2.1.1 蛋白质分子的组成2.1.2 蛋白质分子的结构分类2.2 蛋白质结构研究中主要用到的数据库2.2.1 蛋白质结构数据库2.2.2 蛋白质结构分类数据库2.2.3 蛋白质结构二次数据库2.3 一些常用的蛋白质二级结构预测方法2.3.1 基于统计的预测方法2.3.2 基于知识的预测方法2.3.3 混合预测方法2.4 本章小结第3章 数据挖掘相关技术3.1 数据挖掘的基本概念3.2 关联规则挖掘技术3.2.1 关联规则挖掘的概念3.2.2 关联规则挖掘的描述3.3 遗传算法3.3.1 遗传算法的产生背景及思想3.3.2 简单遗传算法3.4 模拟退火算法3.4.1 模拟退火算法的基本思想3.4.2 模拟退火算法的描述3.5 本章小结第4章 基于遗传算法的蛋白质二级结构预测4.1 模式规则挖掘算法4.1.1 模式规则挖掘算法的可行性分析4.1.2 建立数学模型4.1.3 基于简单遗传算法的模式规则挖掘算法4.1.4 基于模拟退火遗传算法的模式规则挖掘算法4.2 蛋白质二级结构预测算法4.3 本章小结第5章 实验分析与比较5.1 实验数据与结果对比5.1.1 数据的来源5.1.2 实验环境5.1.3 实现算法的参数设定5.1.4 实验结果比较5.2 对两种模式规则挖掘算法的对比分析5.3 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢附录 蛋白质二级结构预测选取的数据集
相关论文文献
标签:蛋白质二级结构预测论文; 关联规则论文; 遗传算法论文; 模拟退火论文;