基于遗传算法的蛋白质二级结构预测研究

基于遗传算法的蛋白质二级结构预测研究

论文摘要

随着后基因时代的到来,蛋白质组学研究正成为生命科学中一个重要的研究领域。在目前的蛋白质组学研究中,蛋白质二级结构预测仍然是一项长期的历史任务和挑战。这一领域的任何新突破,都将有助于更好地理解蛋白质功能、人类健康和疾病的细胞组成结构,对医药、农业和生物科技等应用领域也有着及其重要的指导意义。本文应用生物信息学中有关蛋白质结构及其预测的理论,结合数据挖掘的方法技术,对蛋白质二级结构预测的相关问题进行了深入细致研究。分析研究工作主要包括以下两个方面。第一,从分析研究当前生物信息学中蛋白质二级结构预测领域的理论知识及研究发展现状入手,找出现阶段进行蛋白质二级结构预测所面临的困难,确定本文的研究方向。第二,按照氨基酸的亲-疏水性质,结合从目前蛋白质数据库提取出的极具代表性已知数据,建立起有效的数学模型;通过对关联规则、遗传算法、模拟退火等数据挖掘方法技术的研究与分析比较,利用简单遗传算法结合关联规则的数据挖掘技术,来实现基于简单遗传算法的模式规则挖掘,并在此基础之上完成蛋白质二级结构的预测。同时,本文将模拟退火遗传算法引入到蛋白质二级结构预测的模式规则挖掘中来,以克服简单遗传算法存在最为严重的“过早收敛”问题和模拟退火收敛速度慢和易陷入局部收敛的缺陷。最后,设计实验对在蛋白质二级结构预测中,采用的基于简单遗传算法的模式规则挖掘策略和基于模拟退火遗传算法的模式规则挖掘策略进行分析比较,验证算法改进的有效性和正确性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景及意义
  • 1.1.1 课题的研究背景
  • 1.1.2 课题的研究意义
  • 1.2 蛋白质二级结构的研究发展现状
  • 1.2.1 蛋白质二级结构预测的发展过程
  • 1.2.2 国内外研究发展现状
  • 1.2.3 面临的困难与挑战
  • 1.3 本文的组织结构
  • 第2章 蛋白质与蛋白质二级结构预测
  • 2.1 蛋白质
  • 2.1.1 蛋白质分子的组成
  • 2.1.2 蛋白质分子的结构分类
  • 2.2 蛋白质结构研究中主要用到的数据库
  • 2.2.1 蛋白质结构数据库
  • 2.2.2 蛋白质结构分类数据库
  • 2.2.3 蛋白质结构二次数据库
  • 2.3 一些常用的蛋白质二级结构预测方法
  • 2.3.1 基于统计的预测方法
  • 2.3.2 基于知识的预测方法
  • 2.3.3 混合预测方法
  • 2.4 本章小结
  • 第3章 数据挖掘相关技术
  • 3.1 数据挖掘的基本概念
  • 3.2 关联规则挖掘技术
  • 3.2.1 关联规则挖掘的概念
  • 3.2.2 关联规则挖掘的描述
  • 3.3 遗传算法
  • 3.3.1 遗传算法的产生背景及思想
  • 3.3.2 简单遗传算法
  • 3.4 模拟退火算法
  • 3.4.1 模拟退火算法的基本思想
  • 3.4.2 模拟退火算法的描述
  • 3.5 本章小结
  • 第4章 基于遗传算法的蛋白质二级结构预测
  • 4.1 模式规则挖掘算法
  • 4.1.1 模式规则挖掘算法的可行性分析
  • 4.1.2 建立数学模型
  • 4.1.3 基于简单遗传算法的模式规则挖掘算法
  • 4.1.4 基于模拟退火遗传算法的模式规则挖掘算法
  • 4.2 蛋白质二级结构预测算法
  • 4.3 本章小结
  • 第5章 实验分析与比较
  • 5.1 实验数据与结果对比
  • 5.1.1 数据的来源
  • 5.1.2 实验环境
  • 5.1.3 实现算法的参数设定
  • 5.1.4 实验结果比较
  • 5.2 对两种模式规则挖掘算法的对比分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 附录 蛋白质二级结构预测选取的数据集
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于遗传算法的蛋白质二级结构预测研究
    下载Doc文档

    猜你喜欢