论文摘要
研究信号转导是了解生命活动过程的重要途径。随着实验方法的改进和实验数据的积累,对已有信号转导数据的分析和利用成为生物学家面临的一大挑战,本文旨在使用生物信息学方法解决网络结构分析、信号流走向确定等问题。首先,本文介绍了信号网络的基本组成、一般作用方式和特点,综述了生物信息学在信号网络研究方面取得的最新进展,包括相关的数据库资源、网络的结构属性分析、自动通路重建、网络的建模和仿真方法等。在信号网络中,衡量单个蛋白质的重要性有助于发现细胞过程中关键的蛋白质以及生物系统的薄弱环节,进一步辅助疾病诊断,具有重要的理论意义和实用价值。但是该领域中缺乏这方面的评价指标,因此本文提出了一种新的指标SigFlux,该指标与基因必要性和进化速率显著相关,表明它可以用于度量信号网络中单个蛋白质的重要性。同时,还发现高-SigFlux值、低-连接度的蛋白质在重要分子如受体和转录因子中显著富集,证明该指标能够在整个网络的范围内度量蛋白质的重要性。其次,在信号网络中,信号流走向是蛋白质相互作用的重要属性。然而,目前高通量技术得到的大部分蛋白质相互作用都被假定为是没有方向的。为了解决这个问题,本文基于结构域定义了一个新的参数PIDS,以预测蛋白质相互作用对之间的信号流走向,用于推断信号网络中蛋白质相互作用的信号流走向。以人、小鼠、大鼠、果蝇和酵母中已知方向的蛋白质相互作用作为黄金标准阳性集,蛋白质复合体作为标准阴性集。采用5倍交叉验证对该方法进行评估,准确率为89.79%,覆盖度为48.08%,错误率为16.91%。同时,本文还研究了GO(基因本体论)功能注释以及蛋白质序列与信号流之间的关系,使用自定义函数和支持向量机方法预测成对蛋白质相互作用之间的信号流走向,进一步提高了准确率和覆盖度。再次,本文采用贝叶斯方法整合结构域、蛋白质功能等多种数据源进行信号流走向的预测,利用综合的似然比打分值判断方向,比任意单个预测方法具有最高的可信度和最广的应用范围。在一个合适的似然比阈值16时,贝叶斯方法在人的数据集中的准确率和覆盖度分别为98.64%和67.83%,表明该方法具有相当高的应用价值。该方法已被开发成在线网页工具,提供公共服务,允许用户在自己的蛋白质相互作用数据集上推断信号通路。最后,本文将发展的新方法用于整合的人类蛋白质相互作用网络,推断出一个高可信的有向信号网络。该网络由5,111个蛋白质和10,051对相互作用组成,包含了大量潜在的信号通路。该网络与已知数据库的重合部分具有89.23%的准确率,并且在功能注释、亚细胞定位和网络拓扑方面,呈现出与信号网络高度一致的性质。比较原有通路预测方法,本文提出了多种新的方法用于蛋白质组规模的相互作用中信号流走向预测,提供蛋白质相互作用网络的整体方向性注释。不仅能够推断出蛋白质相互作用网络中大量的潜在信号通路,而且可以提供对于信号网络的全面理解。总之,本文采用生物信息学方法对信号网络进行了深入研究,从信号网络中单个蛋白质重要性度量到潜在信号通路推断,对于解释信号网络的作用机制提供了全新的视野,并且可以辅助实验设计和药物发现,具有重要的实用价值和广阔的应用前景。
论文目录
摘要ABSTRACT第一章 绪论1.1 信号转导通路的功能和结构1.1.1 信号转导的功能1.1.2 信号的种类1.1.3 信号的归宿1.1.4 信号通路的组分1.2 信号网络的作用机制1.2.1 动态性1.2.2 复杂性1.2.3 网络化1.2.4 专一性1.3 信号网络的生物信息学研究1.3.1 数据库资源1.3.2 结构属性分析1.3.3 通路自动重建1.3.4 建模和仿真1.3.5 大规模信号网络研究给生物信息学带来的挑战1.4 论文的研究内容和创新点1.5 论文结构第二章 信号网络中单个蛋白质重要性的度量2.1 数据集2.1.1 小鼠的海马神经元中的信号网络2.1.2 小鼠基因敲除表型2.1.3 小鼠进化速率2.2 用于度量蛋白质重要性的新指标SigFlux2.2.1 SigFlux 定义2.2.2 SigFlux 计算2.3 SigFlux 与蛋白质的必要性显著相关2.4 SigFlux 可以指示蛋白质的进化速率2.5 SigFlux 与连接度的比较2.5.1 SigFlux 和连接度分别表征蛋白质的整体属性和局部属性2.5.2 蛋白质的SigFlux 和连接度分布2.6 本章小结第三章 基于结构域预测蛋白质相互作用中的信号流走向3.1 数据集3.1.1 高可信度的结构域相互作用3.1.2 信号网络中的蛋白质相互作用3.2 基于结构域预测蛋白质相互作用中信号流走向的方法3.2.1 结构域相互作用和蛋白质相互作用的方向3.2.2 用于度量结构域相互作用方向的函数F3.2.3 用于度量蛋白质相互作用方向的参数PIDS3.3 方法评估3.3.1 5 倍交叉验证结果3.3.2 在不同物种中的性能3.3.3 在不同信号通路中的性能3.4 本章小结第四章 基于蛋白质功能注释预测蛋白质相互作用中信号流走向4.1 蛋白质功能注释4.1.1 GO 注释工具4.1.2 参与有向相互作用的蛋白质的GO 注释4.2 根据功能注释预测蛋白质相互作用中信号流走向的方法4.3 方法评估4.3.1 5 倍交叉验证结果4.3.2 在不同物种中的性能4.4 本章小结第五章 基于蛋白质序列预测蛋白质相互作用中信号流走向5.1 蛋白质序列的数学表示方法5.1.1 氨基酸分类5.1.2 氨基酸序列表示5.2 支持向量机方法介绍5.2.1 基本原理5.2.2 算法流程5.3 根据蛋白质序列预测蛋白质相互作用中信号流走向的方法5.3.1 序列表示方法选择5.3.2 分类方法选择5.4 方法评估5.5 本章小结第六章 采用贝叶斯方法整合多数据源预测蛋白质相互作用中信号流走向6.1 贝叶斯整合方法的建立6.1.1 贝叶斯方法介绍6.1.2 PIDS 分组似然比6.1.3 GODS 分组似然比6.1.4 贝叶斯方法综合似然比6.2 贝叶斯方法评估6.2.1 基于结构域和功能注释的方法与贝叶斯方法结果比较6.2.2 在不同物种中的性能6.3 预测蛋白质相互作用中信号流走向的网页工具6.4 基于结构域、功能注释和蛋白质序列的方法和贝叶斯方法比较6.5 本章小结第七章 在整合的人蛋白质相互作用网络中推断潜在信号通路并进行属性分析7.1 整合的人类蛋白质相互作用数据集7.2 人蛋白质相互作用网络的方向标注7.2.1 基于结构域方法的预测结果7.2.2 基于GO 注释方法的预测结果7.2.3 贝叶斯整合方法的预测结果7.2.4 基于序列的方法预测结果7.3 预测有向网络的属性分析7.3.1 蛋白质相互作用的检测方法7.3.2 参与有向相互作用的蛋白质的功能注释7.3.3 参与有向相互作用的蛋白质的亚细胞定位7.3.4 有向网络的拓扑属性分析7.3.5 从预测有向图推断新的信号通路7.3.6 采用SigFlux 指标寻找重要蛋白质7.4 本章小结致谢参考文献作者在学期间取得的学术成果附录A 预测得到的有向蛋白质相互作用的部分结果附录B 相关基础知识
相关论文文献
标签:信号转导论文; 通路自动重建论文; 结构域相互作用论文; 蛋白质相互作用方向性打分论文; 功能注释论文; 支持向量机论文; 贝叶斯网络论文;