蛋白质跨膜结构与二硫键连接模式研究

蛋白质跨膜结构与二硫键连接模式研究

论文摘要

蛋白质二级结构预测是分子生物学中的重要问题。随着蛋白质序列数据的飞速增长,己知的蛋白质序列和已知的蛋白质结构之间的差距不断增大,蛋白质结构的预测变得越来越重要。在蛋白质二级结构中,跨膜蛋白的结构预测非常重要。跨膜蛋白在生物体中担负着各种各样的重要功能:细胞的运输,如将营养物质和一些无机电解质输入细胞,而将有毒的或无用的代谢产物排出细胞;细胞膜内外信号的传递及能量转换。研究发现,在基因组中,有大约20%-30%的基因产物被预测为膜蛋白,这样的比率显示了跨膜蛋白在生物体中的重要性。此外,在药物研发过程中,膜蛋白偶联受体是绝大多数药物的作用靶点。膜蛋白的预测研究方法经过几十年的发展,从最开始的统计方法,到最近十几年大量使用的智能方法,已经获得很大的提高。二硫键是由蛋白质的两个半胱氨酸之间配对形成的一种共价键,可以存在于同一条蛋白质多肽链内,也可以存在于不同的多肽链之间。对于许多蛋白质而言,二硫键是它们最终折叠产物的永久特征。二硫键的形成是蛋白质折叠过程中的重要步骤,其形成动力学影响蛋白质折叠的速率和途径,它的错误配对是影响蛋白质多肽链正确折叠的重要原因。二硫键的存在对于维持蛋白质空间结构稳定性,保持其生理活性具有至关重要的意义。利用模式识别技术的生物信息学中,要解决蛋白质二硫键结构连接模式的预测,需要解决如下几个问题:一是如何在海量的数据集中提取用来作为输入的特征向量;二是如何采用有效的降维方法降低输入特征向量的维数和冗余;三是使用怎样的预测工具进行预测。第一个问题关于提取特征。这项研究从很早以前就已经开始。从早期蛋白质二级结构预测使用到的疏水性特征、氨基酸组成成份,到后来使用到的PSSM矩阵向量等等。在本文中,作者结合了7组不同的特征向量用于预测蛋白质二硫键连接模式,它们包括:半胱氨酸偶联、20种氨基酸组成成份、半胱氨酸分离距离、半胱氨酸排序、蛋白质分子量、蛋白质序列长度和蛋白质的二级结构信息。这些向量的总维数623,经过PCA的降维,维数降低到300和500维。第二个问题关于特征降维。经过多年的发展,降维技术已经非常成熟。现在比较常见的降维方法包括:(1)以主成分分析(Principle Component Analysis: PCA)为代表的基于重构误差分析的降维方法;(2)以线性判别分析(Linear Discriminant Analysis: LDA)为代表的基于类别信息获取最优分类方法的降维方法;(3)以独立主元分析(Independent Component Analysis: ICA)为代表的降维方法;(4)以局部线性嵌入(Locally Linear Embedding: LLE)和等距映射(Isometric Mapping: Isomap)为代表的基于流形学习的降维方法。本文将采用PCA方法对623维向量进行降维。第三个问题关于预测工具。目前生物信息学中经常使用到的预测工具包括:(1)支持向量机技术(Support Vector Machine);(2)人工神经网(Neutral Network);(3)贝叶斯网络(Bayesian);(4)隐马尔科夫模型(Hidden Markov Model)。本文使用支持向量机技术中的SVR,即支持向量回归技术。论文的主要创新点有以下几点:对已有的蛋白质二级结构预测算法进行研究,将当前的预测算法分为基于人工智能的方法和融合方法,完成对以往方法的综述。同时也对特殊蛋白质结构——膜蛋白预测方法进行了比较研究;在蛋白质二硫键连接模式预测中,利用PCA降维技术,对多重序列特征向量和二级结构信息特征向量进行特征降维,然后将降维后的数据输入SVR分类器进行分类,提高了预测正确率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 论文研究的背景与意义
  • 1.1.1 蛋白质基础知识
  • 1.1.2 生物信息学的概念
  • 1.1.3 生物信息学的意义
  • 1.1.4 蛋白质二级结构预测
  • 1.1.5 跨膜区蛋白结构预测研究
  • 1.1.6 蛋白质二硫键预测
  • 1.2 本文的主要研究内容和核心问题
  • 1.3 论文的主要内容和结构
  • 第二章 蛋白质二级结构预测的概述
  • 2.1 蛋白质结构的概况
  • 2.1.1 蛋白质的一级结构
  • 2.1.2 蛋白质的二级结构
  • 2.1.3 蛋白质的三级和四级结构
  • 2.2 常见分类器
  • 2.2.1 人工神经网络
  • 2.2.2 隐马尔科夫模型
  • 2.3 蛋白质二级结构的预测方法
  • 2.3.1 蛋白质序列信息的表达方式
  • 2.3.2 蛋白质数据库
  • 2.3.3 蛋白质二级结构预测方法
  • 2.3.4 常见二级结构预测方法的性能
  • 2.4 本章小结
  • 第三章 特殊蛋白结构——膜蛋白结构跨膜区结构研究
  • 3.1 膜蛋白结构
  • 3.1.1 膜蛋白结构概述
  • 3.1.2 膜蛋白结构分析
  • 3.1.3 膜蛋白的研究意义
  • 3.2 膜蛋白结构数据库
  • 3.3 膜蛋白预测方法
  • 3.3.1 膜蛋白的结构类型
  • 3.3.2 膜蛋白预测算法
  • 3.3.3 预测算法效果
  • 3.3.4 结果讨论
  • 3.4 本章小结
  • 第四章 蛋白质二硫键结构研究
  • 4.1 二硫键结构介绍
  • 4.2 二硫键连接模式预测问题的定义
  • 4.3 SWISS-PROT 数据库
  • 4.4 特征向量的选取
  • 4.4.1 多重序列特征
  • 4.4.2 与二级结构预测信息结合
  • 4.5 特征降维
  • 4.5.1PCA 概述
  • 4.5.2 主成分求解
  • 4.6 分类器
  • 4.6.1 支持向量机(SVM)基本思想
  • 4.6.2 线性与非线性情况
  • 4.7 预测方法的评价
  • 4.7.1 交叉验证法
  • 4.7.2 预测方法的评价准则
  • 4.8 预测结果
  • 4.9 本章小结
  • 第五章 总结与展望
  • 5.1 全部工作的总结
  • 5.2 以后工作的展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].化学裂解结合生物质谱对多肽二硫键的定位[J]. 高等学校化学学报 2020(07)
    • [2].二硫键在蛋白质中的作用及其氧化改性研究进展[J]. 中国饲料 2016(17)
    • [3].二硫键的形成与蛋白质的氧化折叠[J]. 中国生物工程杂志 2008(S1)
    • [4].含二硫键多肽药物在肿瘤治疗中的研究进展[J]. 药物生物技术 2020(03)
    • [5].二硫键与蛋白质的结构[J]. 生物学通报 2010(05)
    • [6].重组人白细胞介素13的二硫键解析[J]. 海峡药学 2019(02)
    • [7].二硫键在药物研发中的应用及其研究进展[J]. 中国药物化学杂志 2018(01)
    • [8].蛋白质中二硫键的定位及其质谱分析[J]. 化学进展 2008(06)
    • [9].二元和三元复合物中阳离子硫键与磷键的理论研究[J]. 高等学校化学学报 2019(07)
    • [10].人工设计二硫键增强谷氨酰胺转胺酶热稳定性[J]. 食品与生物技术学报 2015(10)
    • [11].支持向量机方法预测蛋白质结构中的二硫键[J]. 生物信息学 2009(04)
    • [12].二硫键连接的纳米粒子用于细胞内药物递释的研究进展[J]. 中国医药工业杂志 2018(04)
    • [13].抗体分子内的自由巯基和三硫键修饰[J]. 中国生物制品学杂志 2011(10)
    • [14].分光光度法测定食品蛋白质中二硫键的含量[J]. 食品科学 2008(08)
    • [15].利那洛肽的合成[J]. 化工设计通讯 2020(11)
    • [16].红细胞生长刺激蛋白二硫键定位连接方式的测定[J]. 生物技术通讯 2011(05)
    • [17].一种含两对密集二硫键的模拟肽[J]. 有机化学 2010(10)
    • [18].重组人纽兰格林二硫键分析[J]. 药物分析杂志 2008(08)
    • [19].基于特征相关性选择的二硫键预测算法[J]. 计算机与数字工程 2017(11)
    • [20].含二硫键的稻米蛋白质对米饭蒸煮食味品质的影响[J]. 食品科技 2012(09)
    • [21].二硫键对毕赤酵母表达重组人复合α干扰素的降解与聚合影响[J]. 华东理工大学学报(自然科学版) 2009(06)
    • [22].二硫键及其连接方式对防御素抗菌功能的影响研究进展[J]. 生物技术通报 2016(09)
    • [23].选择性氧化形成三对二硫键合成齐考诺肽[J]. 合成化学 2011(01)
    • [24].多二硫键蛋白在大肠杆菌中的表达研究[J]. 生命科学研究 2015(03)
    • [25].二硫键对鲎素结构与活性影响的研究[J]. 中国海洋药物 2018(01)
    • [26].结合蛋白质二级结构信息预测蛋白质空间结构中的二硫键[J]. 计算机应用研究 2011(06)
    • [27].含二硫键铵盐交联水凝胶的制备及其性能研究[J]. 功能材料 2015(06)
    • [28].抗体类生物候选药中三硫键修饰的表征[J]. 中国新药杂志 2015(20)
    • [29].基于含二硫键的小分子单体合成新型转基因载体的研究进展[J]. 材料科学与工程学报 2012(02)
    • [30].氮硫配施对小麦籽粒巯基、二硫键含量与蛋白质品质的影响[J]. 麦类作物学报 2016(01)

    标签:;  ;  ;  ;  

    蛋白质跨膜结构与二硫键连接模式研究
    下载Doc文档

    猜你喜欢