论文摘要
蛋白质的生物功能以其结构为基础。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数量的增长速度。实验上研究蛋白质结构的主要手段有X射线晶体学技术、核磁共振衍射技术、电子纤维技术等。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望利用理论计算的方法直接从序列信息出发来预测蛋白质结构,这是生物信息学研究的重要课题之一。目前,直接从氨基酸序列信息出发来预测蛋白质三级结构还是有很多困难。更多的焦点集中在去预测蛋白质二级结构。由于二级结构单元是多肽链在三维空间折叠的基本元素,二级结构预测通常作为蛋白质空间结构预测的第一步,是蛋白质三级结构预测中重要的中间步骤,也是蛋白质折叠理论研究的重要挑战。本文重点介绍了一种新的方法,即基于4肽结构字的多样性增量二次判别法(简称TPIDQD算法),对2个大小不同的数据库进行了二级结构的预测。同时对325个标准样本集合,进行了二级结构和三级结构关联的研究。(1)新的预测算法大体分三步:首先用定义的三种4肽结构字(alpha、beta、coil)在序列中出现的频次作为多样源,从而建立标准源;然后用多样性增量结合二次判别法对任何一个序列片段中心残基的二级结构进行预测;最后进行一些修正后处理,包括:消除预测中的结构涨落以及用4肽边界字来修正预测后的结构边界。(2)用TPIDQD算法首次对CB513数据库的二级结构进行了预测,3折交叉检验的预测精度Q3达到79.19%。(3)建立了一个新的包括1645个非冗余蛋白质链的数据库,其中蛋白质结构分辨率高于3 Angstroms,序列相似性小于25%。用TPIDQD算法对其中21残基片段中心残基的结构性质进行预测,10折交叉检验得到Q3为79.68%。当考虑长程序列信息时,即取更长的序列片段(大于21残基长度)来预测时,结果将更好。同时随着字库的扩大,用CB513库作为训练集,对1645蛋白库的交叉检验,也取得了79%的精度。(4)对325个蛋白的二级结构和其三级结构的关联进行了研究。我们利用广义的二级结构序列信息,定义了两个蛋白之间的距离,和用相似分表示的两个蛋白的三级结构的距离进行了相关性分析。结果发现在排除了长度的依赖性后,在灵敏度α=0.05和α=0.01上,有300个相关系数是高于阈值的。
论文目录
相关论文文献
- [1].一种新的RNA二级结构三维图形表示及其应用[J]. 生物信息学 2017(01)
- [2].RNA二级结构的数学表示及其应用[J]. 大连交通大学学报 2010(06)
- [3].RNA二级结构的一种新的图形表示及其应用[J]. 中国海洋大学学报(自然科学版) 2009(02)
- [4].RNA二级结构分析方法及在植物系统学研究上的应用[J]. 九江学院学报 2008(03)
- [5].我国揭示RNA二级结构剪接调控新机制[J]. 生物学教学 2014(01)
- [6].基于启发式算法预测含假结RNA二级结构的研究进展[J]. 生物信息学 2011(02)
- [7].基于局部茎搜索的RNA二级结构预测算法[J]. 生物化学与生物物理进展 2009(01)
- [8].RNA二级结构在分子系统学中的应用[J]. 应用预防医学 2008(05)
- [9].研究揭示RNA二级结构剪接调控新机制[J]. 中国家禽 2013(16)
- [10].一种基于RNA二级结构的信息隐藏方案[J]. 郑州轻工业学院学报(自然科学版) 2014(01)
- [11].基于动态规划RNA二级结构的比较[J]. 吉林大学学报(工学版) 2011(S2)
- [12].核糖体RNA二级结构对拓扑结构准确性的影响(英文)[J]. 菌物学报 2011(06)
- [13].HIV-1 RNA基因组二级结构被确定[J]. 广西科学 2009(03)
- [14].含假结RNA二级结构类的图语法[J]. 计算机工程与应用 2008(02)
- [15].RNA二级结构的2D图形表示及相似性分析[J]. 世界科技研究与发展 2010(05)
- [16].应用符号动力学原理实现RNA二级结构的相似性分析[J]. 计算机研究与发展 2013(02)
- [17].基于茎区的自由能算法预测RNA二级结构[J]. 微计算机信息 2009(09)
- [18].图论在RNA二级结构中的应用[J]. 生物信息学 2008(03)
- [19].mRNA翻译起始区二级结构优化提高(R)-羰基还原酶的表达及催化效率[J]. 生物工程学报 2009(12)
- [20].我国在国际上首次破解染色体二级结构[J]. 生物学教学 2014(10)
- [21].拟南芥细胞核中RNA-蛋白相互作用与RNA二级结构呈负相关关系[J]. 中国肿瘤生物治疗杂志 2015(06)
- [22].破解遗传物质二级结构[J]. 科学世界 2014(06)
- [23].曲克芦丁对牛血清白蛋白溶液二级结构影响的研究[J]. 药物分析杂志 2011(01)
- [24].一种新的RNA二级结构特征序列表示及相似性分析[J]. 计算机应用研究 2011(03)
- [25].猪瘟病毒3′非编码区的多态性及其二级结构分析[J]. 中国农业科学 2010(04)
- [26].基于茎区组合的RNA二级结构预测算法[J]. 计算机应用 2010(06)
- [27].再生丝素二级结构的研究现状及发展趋势[J]. 现代丝绸科学与技术 2018(01)
- [28].核酸二级结构的渐进式教学设计[J]. 化学教育 2016(16)
- [29].一种可扩展半径的RNA二级结构密度聚类算法[J]. 小型微型计算机系统 2015(09)
- [30].蛋白质中三联氨基酸数与二级结构数的模型研究[J]. 厦门大学学报(自然科学版) 2009(05)
标签:蛋白质二级结构预测论文; 肽结构字论文; 多样性增量论文; 二次判别法论文; 长程关联论文; 广义二级结构序列论文; 三级结构距离论文; 关联系数论文;