基于分层神经网络的蛋白质二级结构预测

基于分层神经网络的蛋白质二级结构预测

论文摘要

蛋白质二级结构预测,是通过氨基酸序列,预测蛋白质二级结构的过程。氨基酸序列具有不同的长度,不同的氨基酸排列顺序。实验分析表明这种差异能够形成不同的蛋白质结构。研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。随着2003年人类基因组计划测序完成,更加大了未知结构的氨基酸序列与已知结构的氨基酸序列之间的数量差距,所以蛋白质结构预测迫在眉睫。本文所要研究的是如何构建一个蛋白质二级结构预测模型,使之能够更加准确的预测氨基酸对应的蛋白质二级结构。内容包括氨基酸序列的特征提取方式,神经网络结构设计及网络结构算法的选择。1.氨基酸序列特征提取。要对蛋白质结构进行预测,首先必须把氨基酸序列中的信息提取出来,即进行特征提取。选择何种提取方式非常关键,不同的特征提取出的信息大不相同,现在的方法主要从单种氨基酸,氨基酸序列,同源序列比对等不同角度对氨基酸特征进行提取。本文我们采用Psi-Blast方法,提取同源序列的氨基酸特征。实验表明,这种氨基酸特征预测正确率高,而且有扎实的理论依据。2.结构预测。结构预测实际上是根据提取出的有用信息,通过学习分析这些信息,总结出规律,实现对未知结构氨基酸序列的结构预测。对于这种信息维数高,计算量大的问题,借助神经网络是非常有效地。神经网络能够快速学习到序列中包含的特征,实现对结构的预测。而对于网络,选择何种优化算法是至关重要的,不同的算法会差生不同的时间效率,不同的算法对应不同的预测正确率。本文中我们将对各种不同的优化算法进行比较,选择出更适合的优化算法。预测过程中由于各种结构对应的数目差别较大,经常产生不均衡训练的问题,由此我们受计算智能优化算法中装袋原理的启发,我们采用有放回抽取样本的方式使各种结构对应的数目在训练过程中趋于平衡,很好的解决了训练不均衡的为题,而且提高了整个预测结构的正确率。预测过程中对于网络结构的设计也是比较重要的,一般算法采用两层神经网络预测方式,本文中我们尝试使用多层网络方式进行预测,并将多类问题设计成多个二分类问题的集成。通过试验表明,我们的结构设计模型能够更有效的提高预测的正确率。为了寻找一种更优的网络结构,本文首次将分层RBF神经网络(HRBF)应用在蛋白质结构预测中,HRBF不但能够实现对网络参数的优化,而且能够实现网络结构的优化。它不但解决了以前预测时只能提前固定网络结构和采用试探法选择隐层个数的问题,而且还能对高维特征进行选择性输入,实现了对原始输入的降维作用。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景
  • 1.2 生物信息学的应用及展望
  • 1.3 研究目的及现状
  • 1.4 本文研究提纲
  • 第二章 氨基酸序列特征提取算法
  • 2.1 引言
  • 2.2 蛋白质相关知识
  • 2.3 特征提取算法介绍
  • 2.3.1 Chou-Fasman 参数
  • 2.3.2 GOR 方法
  • 2.3.3 特殊位置得分矩阵(PSSM)算法
  • 2.4 蛋白质二级结构预测方法
  • 2.4.1 二级结构预测概述
  • 2.4.2 二级结构预测方法概述
  • 第三章 神经网络及优化方式选择
  • 3.1 引言
  • 3.2 神经网络简介
  • 3.2.1 神经网络结构
  • 3.2.2 神经网络算法描述
  • 3.2.3 神经网络的特点
  • 3.2.4 神经网络与蛋白质结构预测
  • 3.3 优化算法介绍
  • 3.3.1 梯度下降优化神经网络模型算法(BP)
  • 3.3.2 粒子群优化算法(PSO)
  • 3.3.3 分布估计算法(EDA)
  • 3.4 试验数据集及结果评价方式
  • 3.4.1 数据集
  • 3.4.2 分割数据
  • 3.4.3 预测正确率评价方法
  • 3.5 网络优化方式比较
  • 3.5.1 BP 神经网络
  • 3.5.2 PSO 网络设计
  • 3.5.3 EDA 网络设计
  • 第四章 预测模型设计及结果分析
  • 4.1 引言
  • 4.2 均衡数据法提高预测准确率
  • 4.2.1 实现方法
  • 4.2.2 仿真实验
  • 4.3 多层集成分类蛋白质结构预测
  • 4.3.1 集成网络设计
  • 4.3.2 结果分析
  • 4.3.3 问题讨论
  • 4.4 单种串行集成预测方式
  • 4.4.1 集成预测整体架构图
  • 4.4.2 二分类算法
  • 4.4.3 三分类算法
  • 第五章 蛋白质三级结构预测及分层RBF 神经网络介绍
  • 5.1 引言
  • 5.2 蛋白质三级结构预测
  • 5.2.1 蛋白质三级结构及数据集
  • 5.2.2 特征提取算法介绍
  • 5.3 HRBF 网络介绍
  • 5.3.1 RBF 网络
  • 5.3.2 HRBF 介绍
  • 5.3.3 试验结果分析
  • 5.4 集成二分法提高蛋白质结构预测
  • 5.4.1 预测模型结构图
  • 5.4.2 二分类算法
  • 5.4.3 四分类集成算法
  • 5.4.4 结果分析
  • 第六章 结束语
  • 6.1 全文总结
  • 6.2 进一步研发设想
  • 6.3 心得体会
  • 致谢
  • 参考文献
  • 攻读学位其间发表论文目录
  • 相关论文文献

    • [1].蛋白质二级结构指定[J]. 生物信息学 2016(03)
    • [2].蛋白质二级结构在线服务器预测评估[J]. 生物信息学 2019(01)
    • [3].表面增强拉曼光谱对于蛋白质二级结构的酰胺Ⅲ谱带表征(英文)[J]. Chinese Journal of Chemical Physics 2019(05)
    • [4].蛋白质二级结构预测的一种新的编码方式[J]. 工业控制计算机 2015(04)
    • [5].蛋白质二级结构预测的多核学习方法[J]. 计算机应用 2013(S1)
    • [6].蛋白质和变性蛋白质二级结构的FTIR分析进展[J]. 化学研究与应用 2012(08)
    • [7].基于遗传算法的蛋白质二级结构预测方法研究进展[J]. 农机化研究 2009(05)
    • [8].基于混合并行遗传算法的蛋白质二级结构预测[J]. 农机化研究 2009(06)
    • [9].不同贮藏条件对鸡蛋蛋白质二级结构的影响[J]. 黑龙江畜牧兽医 2019(02)
    • [10].蛋白质二级结构预测的一种新的编码方式[J]. 计算机工程与应用 2011(18)
    • [11].基于级联神经网络的蛋白质二级结构预测[J]. 计算机工程 2010(04)
    • [12].蛋白质二级结构预测的结构表达方法研究[J]. 河南师范大学学报(自然科学版) 2009(06)
    • [13].蛋白质二级结构预测方法研究[J]. 计算机工程与应用 2009(36)
    • [14].基于神经网络的蛋白质二级结构预测[J]. 济南大学学报(自然科学版) 2008(02)
    • [15].基于蛋白质二级结构序列的结构型预测[J]. 河北理工大学学报(自然科学版) 2008(03)
    • [16].蛋白质二级结构的二维红外相关光谱模拟研究[J]. 光散射学报 2013(04)
    • [17].蛋白质二级结构预测方法的评价[J]. 生物信息学 2010(03)
    • [18].基于深度学习的八类蛋白质二级结构预测算法[J]. 计算机应用 2017(05)
    • [19].傅里叶红外光谱法研究肌肉蛋白质的二级结构[J]. 食品与发酵工业 2015(10)
    • [20].蛋白质二级结构预测方法初探[J]. 生物技术世界 2014(11)
    • [21].杨树蛋白质二级结构的人工神经网络预测[J]. 西北林学院学报 2014(05)
    • [22].糟蛋减压加工过程中蛋黄蛋白质二级结构的变化研究[J]. 现代食品科技 2013(06)
    • [23].基于多模集成神经网络的蛋白质二级结构预测[J]. 四川理工学院学报(自然科学版) 2011(06)
    • [24].基于条件随机场进行蛋白质二级结构预测[J]. 计算机应用研究 2009(03)
    • [25].基于多度量学习方法的蛋白质二级结构预测[J]. 智能计算机与应用 2014(05)
    • [26].基于复合金字塔模型的蛋白质二级结构预测系统[J]. 科学通报 2009(21)
    • [27].基于红外光谱法的古代丝织品蛋白质二级结构变化分析[J]. 现代丝绸科学与技术 2011(05)
    • [28].网格中基于结构分类和位矩阵编码并行遗传算法的蛋白质二级结构预测[J]. 科学技术与工程 2008(05)
    • [29].储藏微环境对小麦蛋白质二级结构影响[J]. 粮食与油脂 2014(01)
    • [30].基于并行粒子群优化算法的蛋白质二级结构预测[J]. 周口师范学院学报 2014(05)

    标签:;  ;  ;  ;  

    基于分层神经网络的蛋白质二级结构预测
    下载Doc文档

    猜你喜欢