两种特殊类型蛋白质功能残基的预测与生物序列比对

两种特殊类型蛋白质功能残基的预测与生物序列比对

论文摘要

生物信息学对制约生物学发展的诸多问题的探索性研究和得出的具有指导意义的研究成果,受到了生物学、信息学及其相关学科的高度关注,同时也促进了生物信息学自身的快速发展。目前,生物信息学的基本框架已经构建,其着力解决的科学问题也更加清晰、明确。但从学科自身发展的逻辑严密和求解复杂问题的实际效果思考,生物信息学尚有许多工作要做,有些方法需要进一步完善、有些方法则需要设计、开发和创建。本文的主要结果由以下三部分组成:第一部分:推广了SPA算法,使之适用于一般罚分(或得分)矩阵,并做出了数学证明。推广后的SPA算法有了更广的应用范围,可以根据实际问题的需要来调整打分矩阵,进而得到需要的比对结果。这就缓解了使用Hamming矩阵时经常出现的最优比对不唯一的问题,为设计基于SPA的多重序列比对算法打下了基础。第二部分:设计了基于序列的蛋白质功能残基的预测方法,实现了蛋白质功能残基的大规模快速预测,为蛋白质功能实现的机理研究提供参考与指导。预测的结果可用于蛋白质功能残基实验测定的初步筛选,大大地节省了时间、人力和物力,提高了工作效率。使用特征选择算法对设计的特征进行筛选,减少了输入的特征维数,提高了预测的速度;还可以从选中的特征中总结出一些有意义的生物结论。(1)开发了基于序列的预测酶催化残基的方法CRpred。CRpred的预测精度超过了现有的基于序列的预测方法,且与当前的基于结构的预测方法的预测精度相当。对选中特征的分析表明:一些氨基酸(His,Cys,Asp,Arg,Glu,Tyr)有着较高的催化倾向性;而另外一些氨基酸(Val,Ala,Ile,Pro,Leu,Met)则不容易成为催化残基;甘氨酸(Gly)能够为催化部位提供柔韧性;残基的保守性之于预测催化残基至关重要,催化残基通常比一般的残基更保守,对催化倾向性较高的氨基酸保守的残基更有可能成为催化残基;催化残基与特定的序列模式,如CysXXCys,AspXLysXXAsn等相关联;虽然催化残基偏爱一个相对疏水的大环境,但在局部范围内,它们通常被一些亲水残基包围。(2)采用基于原子间距离的定义方式定义RNA绑定残基,设计了基于序列的预测蛋白质的RNA绑定残基的方法RBRpred。相对已有的基于序列的预测方法,RBRpred的预测精度有了提升。通过特征选择得到以下结论:侧链带正电的精氨酸(Arg)和赖氨酸(Lys),容易与带负电的RNA的磷酸基团相互吸引,结合形成稳定结构;甘氨酸(Gly)相对其他的氨基酸体积较小,可以增加RNA绑定部位的柔韧性:侧链带负电的谷氨酸(Glu),以及疏水的亮氨酸(Leu)、缬氨酸(Val)、丙氨酸(Ala)和苯丙氨酸(Phe)不容易出现在RNA绑定部位。序列保守性对蛋白质的RNA绑定残基的预测非常重要。在三种二级结构中,Coil结构的残基,尤其是在较长Coil片段中的残基有着更好的柔韧性,容易与RNA分子发生相互作用:而Helix结构则相反,结构比较稳固,位于其中的残基较难成为RNA绑定残基。相对溶剂可及面积较大的残基更有可能成为RNA绑定残基。第三部分:将广义纠错码应用于DNA计算。针对DNA计算中可能出现的突变误差问题,设计了一个可自动纠错的DNA操作系统。提出了解决DNA计算中突变误差纠正问题的一种方案。

论文目录

  • 摘要
  • Abstract
  • 主要创新点
  • 前言
  • 第一章 引言
  • 1.1 生物信息学概述
  • 1.2 生物信息学的研究内容及现状
  • 1.3 论文要解决的问题
  • 1.4 论文的主要成果与应用
  • 第二章 二重序列比对与SPA算法
  • 2.1 序列比对简介
  • 2.1.1 序列比对的意义与应用
  • 2.1.2 突变的类型
  • 2.1.3 序列比对的方法与类型
  • 2.1.4 序列比对的数学描述
  • 2.2 动态规划算法
  • 2.2.1 算法的基本步骤
  • 2.2.2 动态规划算法的几点说明
  • 2.3 SPA算法
  • 2.3.1 SPA算法的原理与要点
  • 2.3.2 SPA算法的基本算法步骤
  • 2.3.3 关于SPA算法的几点说明
  • 第三章 一般罚分(或得分)矩阵下的SPA算法
  • 3.1 一般得分矩阵下的序列比对模型
  • 3.2 位移突变的统计估计
  • 3.3 模拟计算
  • 第四章 预测酶的催化残基
  • 4.1 简介
  • 4.1.1 酶、催化残基和催化部位
  • 4.1.2 定位酶的催化残基
  • 4.1.3 现有的预测方法
  • 4.1.4 存在的问题与本文的目标
  • 4.2 数据集
  • 4.2.1 数据集的构建
  • 4.2.2 关于数据集的两点说明
  • 4.2.3 精度评估
  • 4.3 预测流程
  • 4.4 基于序列的特征设计
  • 4.4.1 ResType特征
  • 4.4.2 PSSM特征和EntWOP特征
  • 4.4.3 AveCH特征
  • 4.4.4 CRPair特征
  • 4.5 预测模型的构建
  • 4.5.1 分类器选择
  • 4.5.2 特征排序
  • 4.5.3 参数选择
  • 4.5.4 特征选择
  • 4.6 预测结果评估
  • 4.6.1 基准预测方法
  • 4.6.2 初步比较
  • 4.6.3 在T-124数据集上的测试
  • 4.6.4 与FRPred的比较
  • 4.6.5 置信值
  • 4.7 对参数和特征的分析
  • 4.7.1 支持向量机核函数的贡献
  • 4.7.2 特征选择和参数选择的贡献
  • 4.7.3 对特征的初步分析
  • 4.7.4 残基保守性与催化残基的联系
  • 4.7.5 残基类型与催化残基的联系
  • 4.7.6 疏水性和催化残基的联系
  • 4.7.7 序列模式和催化残基的联系
  • 第五章 预测蛋白质的RNA绑定残基
  • 5.1 简介
  • 5.1.1 蛋白质和RNA的相互作用
  • 5.1.2 研究现状
  • 5.1.3 已有的预测方法
  • 5.1.4 RNA绑定残基的定义方式
  • 5.1.5 目前的问题与本文的目标
  • 5.2 数据集
  • 5.2.1 文献数据集
  • 5.2.2 测试数据集
  • 5.2.3 精度评估
  • 5.3 预测流程
  • 5.4 基于序列的特征设计
  • 5.4.1 基于残基类型的特征
  • 5.4.2 基于保守性的特征
  • 5.4.3 基于二级结构的特征
  • 5.4.4 基于相对溶剂可及面积的特征
  • 5.4.5 组合特征
  • 5.4.6 关于PSIPRED和SPINE的一点说明
  • 5.5 预测模型的构建
  • 5.5.1 分类器选择
  • 5.5.2 全局参数选择
  • 5.5.3 特征选择
  • 5.5.4 局部参数选择
  • 5.6 预测结果评估
  • 5.6.1 与已有预测方法的比较
  • 5.6.2 在RB48数据集上的测试
  • 5.6.3 补充说明
  • 5.7 对所选特征的分析
  • 5.7.1 初步分析
  • 5.7.2 对预测的二级结构与相对溶剂可及面积的分析
  • 5.7.3 残基类型与RNA绑定残基的联系
  • 5.7.4 序列保守性与RNA绑定残基的联系
  • 5.7.5 二级结构与RNA绑定残基的联系
  • 5.7.6 相对溶剂可及面积与RNA绑定残基的联系
  • 5.7.7 组合特征与RNA绑定残基的联系
  • 第六章 DNA计算概述
  • 6.1 DNA计算的提出
  • 6.1.1 哈密顿路径问题
  • 6.1.2 Adleman的DNA计算模型
  • 6.2 DNA计算的生物学基础
  • 6.2.1 DNA分子是信息的载体
  • 6.2.2 DNA分子的操作
  • 6.2.3 分子计算
  • 6.3 DNA计算的应用和现状
  • 6.3.1 DNA计算的应用
  • 6.3.2 DNA计算的优点及存在的问题
  • 第七章 可纠错的DNA操作系统及模拟计算
  • 7.1 突变误差的数据空间
  • 7.1.1 突变误差的定义
  • 7.1.2 突变误差的度量问题
  • 7.1.3 突变误差的纠错码
  • 7.2 DNA操作系统中的纠错码设计与应用
  • 7.2.1 DNA计算问题的选择
  • 7.2.2 哈密顿回路问题的DNA操作树
  • 7.2.3 DNA操作树的删除运算
  • 7.2.4 哈密顿回路问题的DNA操作系统
  • 7.2.5 DNA计算中突变误差的克服
  • 7.3 哈密顿回路问题的DNA模拟计算
  • 7.4 小结
  • 第八章 结束语
  • 参考文献
  • 致谢
  • 附录一 推广SPA算法中的定理证明
  • 附录二 CRpred的完整ROC曲线
  • 个人简历
  • 附发表论文
  • 相关论文文献

    • [1].蛋白质相互作用热点残基的预测[J]. 生物物理学报 2013(02)
    • [2].动态残基网络社团视角下的木聚糖酶耐热性分析[J]. 中国生物化学与分子生物学报 2020(10)
    • [3].蛋白质中残基远程相互作用预测算法研究综述[J]. 计算机研究与发展 2017(01)
    • [4].硫酸类肝素中的N-非取代葡糖胺残基的功能、结构与生物合成[J]. 中国生物化学与分子生物学报 2011(07)
    • [5].残基突变对冷休克蛋白热稳定性影响的计算分析研究(英文)[J]. 生物物理学报 2011(08)
    • [6].基于蛋白质进化配对的残基间距离约束挖掘方法[J]. 计算机科学 2015(07)
    • [7].蛹虫草大米培养残基中虫草素提取方法的优化研究[J]. 安徽农业科学 2009(08)
    • [8].蛋白质残基相互作用网络在线服务及可视化分析[J]. 华中师范大学学报(自然科学版) 2020(02)
    • [9].残基相互作用网络特征与木聚糖酶耐热性的关系[J]. 中国生物化学与分子生物学报 2019(11)
    • [10].一种蛋白质三维结构中残基重心的计算方法[J]. 广西科学 2013(02)
    • [11].“残基思想”—推导有限定条件同分异构体的一种有效策略[J]. 化学教与学 2012(08)
    • [12].隐马尔科夫模型基于残基对蛋白质序列的分析[J]. 池州学院学报 2014(03)
    • [13].基于残基涨落的加权氨基酸网络的构建及应用[J]. 北京工业大学学报 2010(12)
    • [14].使用双向LSTM的深度神经网络预测蛋白质残基相互作用[J]. 小型微型计算机系统 2017(03)
    • [15].蛋白质残基接触图预测[J]. 南京理工大学学报 2019(01)
    • [16].信号蛋白中甲硫氨酸残基的可逆性氧化和甲硫氨酸亚砜还原酶[J]. 生物物理学报 2010(10)
    • [17].固有无序蛋白与蛋白质相互作用位点残基特征分析[J]. 生物化学与生物物理进展 2014(05)
    • [18].基于残基-水作用网络的木聚糖酶耐热性研究[J]. 食品与生物技术学报 2019(09)
    • [19].决明胰蛋白酶抑制剂1活性相关残基的定点突变与抑制活性分析[J]. 中国生物工程杂志 2016(10)
    • [20].Discovery Studio 2.0的模块扩展及应用:残基水平非键相互作用能量的自动批量计算[J]. 动物学研究 2011(03)
    • [21].DRSP:蛋白质单残基替换结构数据库(英文)[J]. 生物化学与生物物理进展 2016(08)
    • [22].利用蛹虫草培养残基发酵制酒的工艺研究[J]. 酿酒科技 2014(02)
    • [23].蛋白质-蛋白质界面热点残基预测及其在线工具[J]. 生命科学 2012(01)
    • [24].基于贝叶斯方法的蛋白质界面残基预测[J]. 计算机应用与软件 2009(09)
    • [25].应用残基相互作用探讨嗜热和嗜冷酶稳定机制[J]. 华侨大学学报(自然科学版) 2018(02)
    • [26].新疆紫草根与茎残基部分化学成分及含量的比较研究[J]. 中药材 2012(03)
    • [27].基于接触图残基对距离约束的蛋白质结构预测算法[J]. 计算机科学 2020(01)
    • [28].基于支持向量机的蛋白质相互作用界面热点残基预测[J]. 天津科技大学学报 2015(02)
    • [29].基于三元残基组合对的蛋白质相互作用研究[J]. 药学学报 2017(10)
    • [30].三种配体结合残基的识别[J]. 内蒙古工业大学学报(自然科学版) 2015(04)

    标签:;  ;  ;  ;  

    两种特殊类型蛋白质功能残基的预测与生物序列比对
    下载Doc文档

    猜你喜欢