蛋白质局部结构—局部序列统计势的构建以及RNA结合位点的预测

蛋白质局部结构—局部序列统计势的构建以及RNA结合位点的预测

论文摘要

在本文中,我们设计了一个普适的统计势函数来评价蛋白质局部结构和局部序列之间的相关性。首先我们对天然蛋白中所有的五个残基长度的片段进行分簇。这个分簇是基于残基片段的构象(局部结构字母类型),二级结构类型及溶剂可接近性来进行的。然后对于每一个簇,可以统计得到其天然的氨基酸概率分布。根据这个氨基酸概率分布,我们可以得到给定结构下其序列的统计势。这个氨基酸概率分布,也可以通过使用数据集片段逐个匹配的方法来得到给定序列下其结构的统计势。同前人的局部统计势函数模型不同的是,我们整合考虑了局部环境,而且使用的是片段作为结构单元而不是单个的残基,这样做的好处是不仅可以包含相邻残基的关联性,还可以包含相邻(重叠)片段之间构象的强相关性。我们主要进行了片段threading,赝序列设计,局部结构预测等测试。在这些测试中,我们的统计势相对与现有的其他统计势函数得到了相似甚至更好的性能。这也证明了整合考虑环境因素来获得统计势的优越性,同时也说明这个统计势在序列设计和结构预测等方面是具有广阔的应用前景的。RNA结合蛋白(RNA-binding proteins(RBPs),)同RNA的结合在调节细胞的基本功能中起着重要作用。有一些计算方法通过使用一些序列或者结构-生成的特征来预测RNA结合位点。为了得到更高的预测性能,需要对现今的预测方法有进一步的提高。我们也发现RNA结合位点和非RNA结合的结构邻居的氨基酸组成足不一样的。结合这个结构生成的特征以及进化和其他结构信息后发展的预测RNA结合位点方法,同其他现有的方法相比较,可以显著的提高预测的准确度。我们使用的是多线性回归方法,6-重交叉验证,我们得到的MLR模型最好能达到87.8%的正确率,马修斯相关系数MCC为0.47,特异性为93.4%,能正确的预测出107条RNA结合蛋白链中的52.4%的RNA结合位点。同现有的方法进行比较,我们发现使用了结构邻居的氨基酸组成以后,明显的提高了预测的精度。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 蛋白质局部结构的生物信息学
  • 1.2 局部结构
  • 1.2.1 二级结构(Secondray Structures)
  • 1.2.2 二级结构的指派方法
  • 1.2.3 从二级结构到三级结构
  • 1.3 结构字母表
  • 1.3.1 积木模块(Buiiding Blocks)
  • 1.3.2 子结构(Substructures)
  • 1.3.3 结构积木模块(Structural Buildings Blocks)
  • 1.3.4 局部结构模式(Local Structural Motifs)
  • 1.3.5 低聚子(Oligons)
  • 1.3.6 Librairies
  • 1.3.7(短)小积木模块((Short)Small Building Blocks)
  • 1.3.8 I-sites
  • 1.3.9 Protein Blocks(PB)
  • 1.4 统计势
  • 1.5 核苷酸和氨基酸的相互作用
  • 第2章 蛋白质局部结构-局部序列统计势的构建
  • 2.1 引言
  • 2.2 材料和方法
  • 2.2.1 训练集和测试集
  • 2.2.2 构建局部序列统计势
  • 2.2.3 构建局部结构统计势
  • 2.2.4 测试统计势
  • 2.3 结果和讨论
  • 2.3.1 基于局部结构和局部环境的片段聚簇的有效性
  • 2.3.2 赝序列设计
  • 2.3.3 片段threading
  • 2.3.4 局部结构预测
  • 2.3.5 无空位threading(gapless threading)中识别天然序列
  • 2.3.6 无空位threading(gapless threading)中识别天然结构
  • 2.3.7 loop结构预测
  • 2.5 结论
  • 2.6 Web服务器
  • 2.7 致谢
  • 第3章 RNA结合位点的预测
  • 3.1 引言
  • 3.2 材料和方法
  • 3.2.1 数据集
  • 3.2.2 残基的结构邻居的氨基酸组成
  • 3.2.3 预测的输入信息
  • 3.2.4 多线性回归(Multiple Linear Regression)
  • 3.2.5 预测性能的度量指标
  • 3.3 结果和讨论
  • 3.3.1 RNA结合位点和非RNA结合位点的结构邻居的氨基酸组成
  • 3.3.2 MLR模型使用不同的特征作为输入信息所得到的性能
  • 3.3.3 训练得到MLR模型的各个回归系数
  • 3.3.4 跟现有的方法进行比较
  • 3.3.5 一个例子和web服务器
  • 3.4 结论
  • 3.5 Web服务器
  • 3.6 致谢
  • 第4章 总结和展望
  • 4.1 本文的主要工作内容和创新点
  • 4.1.1 关于局部统计势的构建
  • 4.1.2 关于RNA结合位点的预测
  • 4.2 下一步工作以及展望
  • 参考文献
  • 附录
  • 补充表
  • 致谢
  • 在读期间发表的学术论文与取得的研究成果
  • 相关论文文献

    • [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
    • [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
    • [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
    • [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
    • [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
    • [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
    • [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
    • [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
    • [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
    • [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
    • [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
    • [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
    • [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
    • [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
    • [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
    • [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
    • [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
    • [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
    • [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
    • [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
    • [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
    • [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
    • [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
    • [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
    • [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
    • [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
    • [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
    • [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)

    标签:;  ;  ;  ;  ;  ;  ;  

    蛋白质局部结构—局部序列统计势的构建以及RNA结合位点的预测
    下载Doc文档

    猜你喜欢