论文摘要
蛋白质是生命体赖以生存的营养要素,是细胞组织的重要组成部分。几乎所有的生物过程都与蛋白质发生某种联系。根据蛋白质序列的排列顺序和序列信息确定蛋白质的功能成为生物学研究重点。目前蛋白质序列数量的激增,急需要开发快速、准确地计算工具预测蛋白质的功能。研究蛋白质序列信息与其功能的关系也是这个领域的研究重点。本论文围绕蛋白质功能预测的几个重要方面:蛋白质亚细胞位点预测,蛋白质结构类预测和单序列蛋白质二级结构预测和蛋白质序列内功能Motif发现展开研究,目的是开发一些根据序列信息预测蛋白质功能的方法。论文的主要研究成果如下:在蛋白质亚细胞位点预测研究中,根据Chou提出的伪氨基酸组成离散模型,提出一种改进的伪氨基酸组成模型。使用免疫遗传算法优化附加特征向量的权重。在改进的伪氨基酸组成模型框架中,使用数字信号处理技术和疏水氨基酸对模式表示序列的附加特征,应用扩大的协方差作为预测工具,预测了真核细胞12类亚细胞位点。然后提出了一种基于特征选择的集成分类器的预测方法,用于凋谢蛋白的亚细胞位点预测。使用具有不同间隔的氨基酸对组成表示序列特征,经过特征选择后形成更加有效的特征组合。集成分类器中的基本分类器为模糊K-近邻(FKNN)分类算法,Jackknife测试和独立数据集测试证明了该方法的有效性和实用性。在蛋白质结构类预测研究中,提出了三种结构类预测的方法。第一种是基于二叉树支持向量机的方法,发展了一种新的伪氨基酸组成表示序列的特征。结合了传统的氨基酸组成,序列内氨基酸相互关系和疏水模式,使用二叉树支持向量机作为预测工具,采用标准数据集验证了方法的性能;第二种方法是基于改进的伪氨基酸组成模型的结构类预测方法。将蛋白质序列映射为短的时间序列,计算序列的近似熵,构造了一种27-D的伪氨基酸组成表示序列特征。FKNN分类算法作为预测工具,免疫遗传算法优化附加特征权重系数。在“严格”数据集测试中取得了较好的结果;第三种方法是两层模糊支持向量机网络的方法,在第一层中,基本的分类器是模糊支持向量机,输入数据是基于不同物理化学属性的伪氨基酸组成。组合第一层中各个模糊支持向量机的输出数据,作为第二层模糊支持向量机分类器的输入数据,经过决策后得到最终结果。在蛋白质二级结构预测研究中,提出了基于最大熵概率模型的预测方法。考虑了蛋白质序列的结构类信息和目标残基的上下文环境,设计了影响残基二级结构的特征空间和特征模版。将这些特征都包含进入最大熵概率分布模型中,根据结构类不同分别训练和建立二级结构预测模型。算法中二级结构的特征信息仅来自于序列本身,没有考虑多序列排列信息。目的是解决“孤立”蛋白的二级结构预测问题。实验证明预测算法具有较高的准确率和实用性。由于细胞核内空间狭窄和蛋白质的不稳定性,核内亚空间的蛋白质位点预测成为难点。本论文提出了基于近似熵的伪氨基酸组成方法,采用集成AdaBoost分类器作为预测工具,用于蛋白质亚核位点的预测。在两个标准数据集上的测试表明了该方法的有效性。蛋白质家族内序列具有相似的功能,序列内的重点区域Motif也应该具有相似性。本论文提出了一种Motif发现算法,在蛋白质家族内寻找重要的Motif集合,验证序列所属的蛋白质家族。在连接酶的21个亚家族识别中,建立了一个实用的连接酶亚家族服务器。最后,对全论文的研究内容进行了总结,指出了研究工作中存在的不足,明确了下一步的研究方向。
论文目录
相关论文文献
- [1].北京大学报道单氨基酸精度绘制蛋白质功能图谱新方法[J]. 食品与生物技术学报 2020(03)
- [2].加权优先级网络在蛋白质功能预测中的应用研究[J]. 小型微型计算机系统 2017(09)
- [3].蛋白质功能预测方法研究进展[J]. 智能计算机与应用 2016(04)
- [4].基于多示例多标记迁移学习的蛋白质功能预测[J]. 中国科学:信息科学 2017(11)
- [5].评价蛋白质功能性质的指标及应用进展[J]. 黑龙江畜牧兽医 2015(23)
- [6].面向蛋白质功能位点识别的机器学习平台构建[J]. 生物信息学 2010(01)
- [7].茶多酚与蛋白质的相互作用对蛋白质功能特性的影响研究进展[J]. 食品工业科技 2008(06)
- [8].蛋白质功能预测方法概述[J]. 生物信息学 2013(01)
- [9].基于新型机器学习方法的蛋白质功能预测与分析[J]. 信息通信 2012(05)
- [10].基于K近邻的蛋白质功能的预测方法[J]. 生物医学工程研究 2009(02)
- [11].基于多网络数据协同矩阵分解预测蛋白质功能[J]. 计算机研究与发展 2017(12)
- [12].基于图聚类的蛋白质功能预测方法[J]. 福建师范大学学报(自然科学版) 2015(03)
- [13].蛋白质功能预测的蚁群优化算法[J]. 广西师范大学学报(自然科学版) 2011(03)
- [14].不同改性方法对蛋白质功能性质的影响研究[J]. 食品工业 2015(12)
- [15].基于双重索引矩阵的蛋白质功能预测[J]. 计算机应用 2015(06)
- [16].基于双加权投票的蛋白质功能预测[J]. 计算机科学 2019(04)
- [17].基于0-1矩阵分解的蛋白质功能预测[J]. 中国科学:信息科学 2019(09)
- [18].结合蛋白质互作与功能类的可分性预测蛋白质功能[J]. 中国生物医学工程学报 2009(02)
- [19].基于正负样例的蛋白质功能预测[J]. 计算机研究与发展 2016(08)
- [20].基于随机游走的蛋白质功能预测算法设计与实现[J]. 黑龙江大学工程学报 2015(03)
- [21].基于布尔矩阵分解的蛋白质功能预测框架[J]. 计算机研究与发展 2019(05)
- [22].基于贝叶斯网络和相互作用可信度的蛋白质功能预测方法[J]. 激光生物学报 2009(03)
- [23].通过构建蛋白质结构域功能模版库做基于氨基酸序列的蛋白质功能位点预测(英文)[J]. 复旦学报(自然科学版) 2013(06)
- [24].我国科学家开发了蛋白质瞬时原位激活新技术[J]. 石河子科技 2019(03)
- [25].基于关键功能模块挖掘的蛋白质功能预测[J]. 自动化学报 2018(01)
- [26].基于模糊积分多源数据融合的蛋白质功能预测[J]. 南京大学学报(自然科学版) 2012(01)
- [27].冷榨双低菜子粕中蛋白质功能性质的研究[J]. 湖北农业科学 2016(08)
- [28].食品中蛋白质的功能(七) 食品蛋白质功能特性的影响因素[J]. 肉类研究 2009(10)
- [29].基于MIMLNN的玉米蛋白质功能预测[J]. 现代计算机(专业版) 2018(25)
- [30].改进LPU用于蛋白质功能预测[J]. 计算机工程与科学 2011(12)
标签:蛋白质功能预测论文; 亚细胞定位论文; 蛋白质结构类论文; 二级结构论文; 模糊近邻算法论文; 模糊支持向量机论文; 集成分类算法论文; 发现论文;