蛋白质结构分析的计算方法研究

蛋白质结构分析的计算方法研究

论文摘要

蛋白质结构分析是蛋白质科学领域中非常重要的研究内容,许多疾病都是由于蛋白质结构遭到破坏而引起的,因此蛋白质结构分析研究能够对医学、药学等领域产生重大影响。蛋白质折叠和蛋白质结构域预测是蛋白质结构分析中非常重要的两个问题,蛋白质折叠研究的是蛋白质结构的动态变化过程,蛋白质结构域预测研究的是蛋白质相对静态的结构,它们的本质是统一的,都是探讨蛋白质的一级结构序列如何影响和决定蛋白质的高级结构。随着学科交叉的日益广泛,越来越多的计算机方法和技术被应用到了蛋白质结构分析研究领域中,例如信号处理,分布式计算,数据挖掘,机器学习等等,这些计算机方法和技术为蛋白质结构分析领域的研究带来了新的生机和活力。本文首先提出了一种新的基于小波分析的蛋白质折叠模拟轨迹分析方法,在该方法中我们采用了DB2小波对折叠模拟轨迹的数据进行了九次的分解和重构滤波处理,并使用该方法分析了Trp-cage蛋白质的折叠模拟轨迹,结果显示我们的方法能够有效地提取折叠中间态和折叠事件,克服自由能图谱分析法的一些不足之处。通过分析,我们总结整理了Trp-cage蛋白质的折叠过程,并且还发现了TRP6的偏向性问题。接着,我们又使用小波分析方法分析了原生型和变异型lysozyme蛋白质的去折叠模拟轨迹中local contact的变化情况,我们的分析显示单点突变后的蛋白质结构非常不稳定,并显示变异点TRP62的ARG-TRP-ARG三明治结构对于lysozyme蛋白质的结构稳定性有着重要影响。同时,本文还提出了一种基于BP神经网络的蛋白质结构域预测方法,用以预测双结构域蛋白质的结构域边界,该方法中的神经网络包含169个输入层节点,5个隐藏层节点和1个输出层节点,网络训练采用了Levenberg-Marquardt算法,共使用了九种不同的特征属性,我们也同时简单分析了这九种特征属性对于最终结果的贡献程度。在该方法基础上,本文又引入了一个新的特征属性PBWLI,同样提出了一种基于BP神经网络的多结构域蛋白质预测方法,该方法的神经网络包含99个输入层节点,9个隐藏层节点和1个输出层节点,预测结果显示我们的方法能够在一定程度上有效地预测多结构域蛋白质的结构域边界。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 蛋白质
  • 1.2.1 蛋白质的组成
  • 1.2.2 蛋白质的结构
  • 1.3 蛋白质折叠
  • 1.3.1 蛋白质折叠的计算机模拟
  • 1.3.2 蛋白质折叠研究问题简述
  • 1.4 蛋白质结构域预测
  • 1.4.1 蛋白质结构域的定义
  • 1.4.2 蛋白质结构域数据库
  • 1.4.3 蛋白质结构域预测问题简述
  • 1.5 小结
  • 第2章 蛋白质结构分析相关综述
  • 2.1 引言
  • 2.2 蛋白质折叠的自由能图谱分析
  • 2.2.1 反应坐标
  • 2.2.2 自由能图谱分析
  • 2.3 蛋白质结构域预测方法
  • 2.3.1 基于三维空间结构的预测方法
  • 2.3.2 基于序列本身的预测方法
  • 2.4 小结
  • 第3章 基于小波分析的Trp-cage蛋白质折叠模拟轨迹分析
  • 3.1 引言
  • 3.2 蛋白质模拟系统设定
  • 3.2.1 蛋白质的选取
  • 3.2.2 计算机模拟系统设置
  • 3.3 正交小波分析方法
  • 3.4 折叠模拟轨迹分析
  • 3.4.1 反应坐标提取
  • 3.4.2 小波滤波处理
  • 3.4.3 中间状态提取
  • 3.4.4 折叠事件分析
  • 3.4.5 非完美的色氨酸结构原因分析
  • 3.5 小结
  • 第4章 基于小波分析的lysozyme蛋白质去折叠模拟轨迹分析
  • 4.1 引言
  • 4.2 蛋白质模拟系统设定
  • 4.2.1 蛋白质系统设置
  • 4.2.2 计算机模拟系统设置
  • 4.3 去折叠模拟轨迹分析
  • 4.3.1 去折叠中的蛋白质结构变化
  • 4.3.2 基于小波的local contact分析
  • 4.3.3 ARG-TRP-ARG结构的作用
  • 4.4 小结
  • 第5章 基于BP神经网络的双结构域蛋白质预测方法
  • 5.1 引言
  • 5.2 数据集准备
  • 5.3 特征属性提取
  • 5.3.1 二级结构和溶剂可及面积
  • 5.3.2 Domain Linker Index
  • 5.3.3 Entropy Index
  • 5.3.4 Flexibility Index
  • 5.3.5 Hydrophobicity Index
  • 5.3.6 AHNC
  • 5.3.7 RPPI
  • 5.3.8 HSNC
  • 5.4 神经网络架构
  • 5.4.1 BP神经网络结构
  • 5.4.2 LM学习训练算法
  • 5.4.3 网络输出后期处理
  • 5.5 预测模型结果分析
  • 5.5.1 在共同数据集上的结果分析
  • 5.5.2 与其他方法的比较
  • 5.5.3 在PPRODO数据集上的结果分析
  • 5.5.4 特征属性相对作用分析
  • 5.6 小结
  • 第6章 基于BP神经网络的多结构域蛋白质预测方法
  • 6.1 引言
  • 6.2 数据集准备
  • 6.3 特征属性提取
  • 6.3.1 二级结构和溶剂可及面积
  • 6.3.2 HSNC
  • 6.3.3 PBWLI
  • 6.4 网络架构和后期处理
  • 6.5 预测模型结果分析
  • 6.5.1 PBWLI结果分析
  • 6.5.2 BP神经网络结果分析
  • 6.5.3 与其它方法的比较
  • 6.6 小结
  • 第7章 总结和展望
  • 7.1 本文总结
  • 7.2 未来工作方向
  • 参考文献
  • 作者简历及在学期间所取得的科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    蛋白质结构分析的计算方法研究
    下载Doc文档

    猜你喜欢