蛋白质序列编码与功能预测

蛋白质序列编码与功能预测

论文摘要

自从人类基因计划实施以来,各种生物序列数据信息呈爆炸式增长,生命科学的研究已进入了后基因时代。核酸、蛋白质序列信息不断地增长,大量参与生命活动的蛋白质的功能却知之很少。因而对蛋白质的功能预测成为当今信息生物信息学的主要任务之一。由于海量的序列,传统实验的方法已远远不能赶上序列分析的步伐。因而怎么对这些蛋白质的氨基酸序列进行挑选,分析,处理,标注成为当今又一个热点及难点。本论文研究的主要内容就是蛋白质功能类预测方面的问题。主要的工作内容如下:提出了蛋白质功能类预测方法的一种数据集选择方法。蛋白质功能类预测方法中一个必要步骤是数据训练集的选择。一般的方法是选取尽可能大的样本训练集。本论文做出了一些探索,首先把所得到的样本集序列按照蛋白质序列长度从小到大进行重新进行排列,并按新序列顺序从小到大取相同数目一系列的样本集,在各个样本集中做功能预测,得到序列长度与序列特征关系在蛋白质功能预测的影响关系。提出了基于测试样本序列长度的选择最邻近样本序列训练集,这样取得的训练样本集较小。然后与一般法对比做功能预测,采取Profile编码为基础,并使用NNA方法做分类检测,两者的预测率几乎相同。实验结果表明,这种选取数据训练集的方法是有效的。另外,提出了一种基于聚类的蛋白质功能预测方法。为了提取蛋白质序列的更多的特征信息,提出了两种编码,比较并选取了ProfileAA编码,它融合氨基酸的组成信息、氨基酸的物化性质信息。并与其它三类编码进行比较,证明其合理性。然后再做基于最小路径聚类的功能预测,为了较好的评估,基于自身的分类方法,做基于聚类的功能类预测与未基于聚类的功能类预测方法的比较,再与其它作者的方法做比较,最后的预测结果表明,这种基于聚类的蛋白质功能类预测方法取得较高预测率。

论文目录

  • 摘要
  • Abstract
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 引论
  • 1.2 研究背景及意义
  • 1.3 国内外蛋白质功能预测研究的现状
  • 1.3.1 基于序列的功能预测
  • 1.3.2 基于结构的功能预测
  • 1.3.3 基于蛋白相互作用信息的功能预测
  • 1.3.4 各种功能预测方法比较
  • 1.4 本文研究的主要内容
  • 1.5 本论文的结构安排
  • 第2章 蛋白序列的编码与功能预测
  • 2.1 蛋白质功能预测的预备知识
  • 2.1.1 蛋白质分子的组成、物化性质
  • 2.1.2 蛋白质分子结构
  • 2.2 蛋白质功能预测过程
  • 2.3 蛋白质特征提取与功能编码
  • 2.3.1 简单的序列编码方式
  • 2.3.2 Profile 编码
  • 2.3.3 DipeptideCompsition 编码
  • 2.3.4 基于 EDP 的序列编码
  • 2.3.5 BioSimilarity 编码方法
  • 2.3.6 PseAA 编码方法
  • 2.3.7 基于 CIS 编码方法
  • 2.3.8 各种编码之比较
  • 2.4 相似函数
  • 2.4.1 距离测度
  • 2.4.2 相近测度
  • 2.4.3 匹配测度
  • 2.4.4 测度小结
  • 2.5 蛋白质功能类分类算法
  • 2.5.1 KNN 算法
  • 2.5.2 贝叶斯分类算法
  • 2.5.3 遗传算法
  • 2.6 蛋白质功能预测性能评估
  • 2.7 小结
  • 第3章 蛋白质功能类预测的一种数据集选取法
  • 3.1 引言
  • 3.2 数据集
  • 3.3 原理与方法
  • 3.4 结果与讨论
  • 3.5 小结
  • 第4章 基于聚类的蛋白质功能预测
  • 4.1 引言
  • 4.2 提取特征与编码
  • 4.2.1 ExtendProfile 编码
  • 4.2.2 ProfileAA 编码
  • 4.2.3 各类编码比较
  • 4.3 聚类方类
  • 4.4 分类算法
  • 4.5 结果与讨论
  • 4.6 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录 A 攻读学位期间所发表的学术论文及所参加项目
  • 相关论文文献

    • [1].北京大学报道单氨基酸精度绘制蛋白质功能图谱新方法[J]. 食品与生物技术学报 2020(03)
    • [2].加权优先级网络在蛋白质功能预测中的应用研究[J]. 小型微型计算机系统 2017(09)
    • [3].蛋白质功能预测方法研究进展[J]. 智能计算机与应用 2016(04)
    • [4].基于多示例多标记迁移学习的蛋白质功能预测[J]. 中国科学:信息科学 2017(11)
    • [5].评价蛋白质功能性质的指标及应用进展[J]. 黑龙江畜牧兽医 2015(23)
    • [6].面向蛋白质功能位点识别的机器学习平台构建[J]. 生物信息学 2010(01)
    • [7].茶多酚与蛋白质的相互作用对蛋白质功能特性的影响研究进展[J]. 食品工业科技 2008(06)
    • [8].蛋白质功能预测方法概述[J]. 生物信息学 2013(01)
    • [9].基于新型机器学习方法的蛋白质功能预测与分析[J]. 信息通信 2012(05)
    • [10].基于K近邻的蛋白质功能的预测方法[J]. 生物医学工程研究 2009(02)
    • [11].基于多网络数据协同矩阵分解预测蛋白质功能[J]. 计算机研究与发展 2017(12)
    • [12].基于图聚类的蛋白质功能预测方法[J]. 福建师范大学学报(自然科学版) 2015(03)
    • [13].蛋白质功能预测的蚁群优化算法[J]. 广西师范大学学报(自然科学版) 2011(03)
    • [14].不同改性方法对蛋白质功能性质的影响研究[J]. 食品工业 2015(12)
    • [15].基于双重索引矩阵的蛋白质功能预测[J]. 计算机应用 2015(06)
    • [16].基于双加权投票的蛋白质功能预测[J]. 计算机科学 2019(04)
    • [17].基于0-1矩阵分解的蛋白质功能预测[J]. 中国科学:信息科学 2019(09)
    • [18].结合蛋白质互作与功能类的可分性预测蛋白质功能[J]. 中国生物医学工程学报 2009(02)
    • [19].基于正负样例的蛋白质功能预测[J]. 计算机研究与发展 2016(08)
    • [20].基于随机游走的蛋白质功能预测算法设计与实现[J]. 黑龙江大学工程学报 2015(03)
    • [21].基于布尔矩阵分解的蛋白质功能预测框架[J]. 计算机研究与发展 2019(05)
    • [22].基于贝叶斯网络和相互作用可信度的蛋白质功能预测方法[J]. 激光生物学报 2009(03)
    • [23].通过构建蛋白质结构域功能模版库做基于氨基酸序列的蛋白质功能位点预测(英文)[J]. 复旦学报(自然科学版) 2013(06)
    • [24].我国科学家开发了蛋白质瞬时原位激活新技术[J]. 石河子科技 2019(03)
    • [25].基于关键功能模块挖掘的蛋白质功能预测[J]. 自动化学报 2018(01)
    • [26].基于模糊积分多源数据融合的蛋白质功能预测[J]. 南京大学学报(自然科学版) 2012(01)
    • [27].冷榨双低菜子粕中蛋白质功能性质的研究[J]. 湖北农业科学 2016(08)
    • [28].食品中蛋白质的功能(七) 食品蛋白质功能特性的影响因素[J]. 肉类研究 2009(10)
    • [29].基于MIMLNN的玉米蛋白质功能预测[J]. 现代计算机(专业版) 2018(25)
    • [30].改进LPU用于蛋白质功能预测[J]. 计算机工程与科学 2011(12)

    标签:;  ;  ;  ;  ;  

    蛋白质序列编码与功能预测
    下载Doc文档

    猜你喜欢