大规模信号网络的结构属性分析和自动重建

大规模信号网络的结构属性分析和自动重建

论文摘要

研究信号转导是了解生命活动过程的重要途径。随着实验方法的改进和实验数据的积累,对已有信号转导数据的分析和利用成为生物学家面临的一大挑战,本文旨在使用生物信息学方法解决网络结构分析、信号流走向确定等问题。首先,本文介绍了信号网络的基本组成、一般作用方式和特点,综述了生物信息学在信号网络研究方面取得的最新进展,包括相关的数据库资源、网络的结构属性分析、自动通路重建、网络的建模和仿真方法等。在信号网络中,衡量单个蛋白质的重要性有助于发现细胞过程中关键的蛋白质以及生物系统的薄弱环节,进一步辅助疾病诊断,具有重要的理论意义和实用价值。但是该领域中缺乏这方面的评价指标,因此本文提出了一种新的指标SigFlux,该指标与基因必要性和进化速率显著相关,表明它可以用于度量信号网络中单个蛋白质的重要性。同时,还发现高-SigFlux值、低-连接度的蛋白质在重要分子如受体和转录因子中显著富集,证明该指标能够在整个网络的范围内度量蛋白质的重要性。其次,在信号网络中,信号流走向是蛋白质相互作用的重要属性。然而,目前高通量技术得到的大部分蛋白质相互作用都被假定为是没有方向的。为了解决这个问题,本文基于结构域定义了一个新的参数PIDS,以预测蛋白质相互作用对之间的信号流走向,用于推断信号网络中蛋白质相互作用的信号流走向。以人、小鼠、大鼠、果蝇和酵母中已知方向的蛋白质相互作用作为黄金标准阳性集,蛋白质复合体作为标准阴性集。采用5倍交叉验证对该方法进行评估,准确率为89.79%,覆盖度为48.08%,错误率为16.91%。同时,本文还研究了GO(基因本体论)功能注释以及蛋白质序列与信号流之间的关系,使用自定义函数和支持向量机方法预测成对蛋白质相互作用之间的信号流走向,进一步提高了准确率和覆盖度。再次,本文采用贝叶斯方法整合结构域、蛋白质功能等多种数据源进行信号流走向的预测,利用综合的似然比打分值判断方向,比任意单个预测方法具有最高的可信度和最广的应用范围。在一个合适的似然比阈值16时,贝叶斯方法在人的数据集中的准确率和覆盖度分别为98.64%和67.83%,表明该方法具有相当高的应用价值。该方法已被开发成在线网页工具,提供公共服务,允许用户在自己的蛋白质相互作用数据集上推断信号通路。最后,本文将发展的新方法用于整合的人类蛋白质相互作用网络,推断出一个高可信的有向信号网络。该网络由5,111个蛋白质和10,051对相互作用组成,包含了大量潜在的信号通路。该网络与已知数据库的重合部分具有89.23%的准确率,并且在功能注释、亚细胞定位和网络拓扑方面,呈现出与信号网络高度一致的性质。比较原有通路预测方法,本文提出了多种新的方法用于蛋白质组规模的相互作用中信号流走向预测,提供蛋白质相互作用网络的整体方向性注释。不仅能够推断出蛋白质相互作用网络中大量的潜在信号通路,而且可以提供对于信号网络的全面理解。总之,本文采用生物信息学方法对信号网络进行了深入研究,从信号网络中单个蛋白质重要性度量到潜在信号通路推断,对于解释信号网络的作用机制提供了全新的视野,并且可以辅助实验设计和药物发现,具有重要的实用价值和广阔的应用前景。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 信号转导通路的功能和结构
  • 1.1.1 信号转导的功能
  • 1.1.2 信号的种类
  • 1.1.3 信号的归宿
  • 1.1.4 信号通路的组分
  • 1.2 信号网络的作用机制
  • 1.2.1 动态性
  • 1.2.2 复杂性
  • 1.2.3 网络化
  • 1.2.4 专一性
  • 1.3 信号网络的生物信息学研究
  • 1.3.1 数据库资源
  • 1.3.2 结构属性分析
  • 1.3.3 通路自动重建
  • 1.3.4 建模和仿真
  • 1.3.5 大规模信号网络研究给生物信息学带来的挑战
  • 1.4 论文的研究内容和创新点
  • 1.5 论文结构
  • 第二章 信号网络中单个蛋白质重要性的度量
  • 2.1 数据集
  • 2.1.1 小鼠的海马神经元中的信号网络
  • 2.1.2 小鼠基因敲除表型
  • 2.1.3 小鼠进化速率
  • 2.2 用于度量蛋白质重要性的新指标SigFlux
  • 2.2.1 SigFlux 定义
  • 2.2.2 SigFlux 计算
  • 2.3 SigFlux 与蛋白质的必要性显著相关
  • 2.4 SigFlux 可以指示蛋白质的进化速率
  • 2.5 SigFlux 与连接度的比较
  • 2.5.1 SigFlux 和连接度分别表征蛋白质的整体属性和局部属性
  • 2.5.2 蛋白质的SigFlux 和连接度分布
  • 2.6 本章小结
  • 第三章 基于结构域预测蛋白质相互作用中的信号流走向
  • 3.1 数据集
  • 3.1.1 高可信度的结构域相互作用
  • 3.1.2 信号网络中的蛋白质相互作用
  • 3.2 基于结构域预测蛋白质相互作用中信号流走向的方法
  • 3.2.1 结构域相互作用和蛋白质相互作用的方向
  • 3.2.2 用于度量结构域相互作用方向的函数F
  • 3.2.3 用于度量蛋白质相互作用方向的参数PIDS
  • 3.3 方法评估
  • 3.3.1 5 倍交叉验证结果
  • 3.3.2 在不同物种中的性能
  • 3.3.3 在不同信号通路中的性能
  • 3.4 本章小结
  • 第四章 基于蛋白质功能注释预测蛋白质相互作用中信号流走向
  • 4.1 蛋白质功能注释
  • 4.1.1 GO 注释工具
  • 4.1.2 参与有向相互作用的蛋白质的GO 注释
  • 4.2 根据功能注释预测蛋白质相互作用中信号流走向的方法
  • 4.3 方法评估
  • 4.3.1 5 倍交叉验证结果
  • 4.3.2 在不同物种中的性能
  • 4.4 本章小结
  • 第五章 基于蛋白质序列预测蛋白质相互作用中信号流走向
  • 5.1 蛋白质序列的数学表示方法
  • 5.1.1 氨基酸分类
  • 5.1.2 氨基酸序列表示
  • 5.2 支持向量机方法介绍
  • 5.2.1 基本原理
  • 5.2.2 算法流程
  • 5.3 根据蛋白质序列预测蛋白质相互作用中信号流走向的方法
  • 5.3.1 序列表示方法选择
  • 5.3.2 分类方法选择
  • 5.4 方法评估
  • 5.5 本章小结
  • 第六章 采用贝叶斯方法整合多数据源预测蛋白质相互作用中信号流走向
  • 6.1 贝叶斯整合方法的建立
  • 6.1.1 贝叶斯方法介绍
  • 6.1.2 PIDS 分组似然比
  • 6.1.3 GODS 分组似然比
  • 6.1.4 贝叶斯方法综合似然比
  • 6.2 贝叶斯方法评估
  • 6.2.1 基于结构域和功能注释的方法与贝叶斯方法结果比较
  • 6.2.2 在不同物种中的性能
  • 6.3 预测蛋白质相互作用中信号流走向的网页工具
  • 6.4 基于结构域、功能注释和蛋白质序列的方法和贝叶斯方法比较
  • 6.5 本章小结
  • 第七章 在整合的人蛋白质相互作用网络中推断潜在信号通路并进行属性分析
  • 7.1 整合的人类蛋白质相互作用数据集
  • 7.2 人蛋白质相互作用网络的方向标注
  • 7.2.1 基于结构域方法的预测结果
  • 7.2.2 基于GO 注释方法的预测结果
  • 7.2.3 贝叶斯整合方法的预测结果
  • 7.2.4 基于序列的方法预测结果
  • 7.3 预测有向网络的属性分析
  • 7.3.1 蛋白质相互作用的检测方法
  • 7.3.2 参与有向相互作用的蛋白质的功能注释
  • 7.3.3 参与有向相互作用的蛋白质的亚细胞定位
  • 7.3.4 有向网络的拓扑属性分析
  • 7.3.5 从预测有向图推断新的信号通路
  • 7.3.6 采用SigFlux 指标寻找重要蛋白质
  • 7.4 本章小结
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 附录A 预测得到的有向蛋白质相互作用的部分结果
  • 附录B 相关基础知识
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    大规模信号网络的结构属性分析和自动重建
    下载Doc文档

    猜你喜欢