论文摘要
细胞代谢是维持生命所必不可少的过程。在代谢过程中,通过特定的生物化学反应,一些物质被分解,从而为基本的生命过程提供能量,同时合成另一些生命所必需的物质。发生在某物种的活细胞内所有代谢反应构成了此物种的代谢网络。尽管在不同的物种中有大量的代谢反应,代谢网络却是高度保守的。随着很多物种的基因组测序项目的展开,人们获得了许多全基因组序列,因而能够从全基因组信息中可靠地重建物种特异的代谢网络。因此从代谢网络预测功能就成为后基因组时代研究的基本问题之一。分析代谢网络有助于理解和利用细胞代谢过程,并可能促进发酵技术和医药产业的发展。另一方面,代谢网络的拓扑结构能反映它的形成和进化的动力学,对网络结构的研究能帮助我们了解生命进化的历史。本论文从研究代谢网络的拓扑结构出发,探索其结构、功能及进化之间的相互关系。基于已有的代谢网络数据库,重构了75个物种的全基因组代谢网络,其中包含8个真核生物、56个细菌和11个古菌物种。经研究发现了这些网络共同的一些拓扑特征,以及这些结构特性所具有的功能和进化意义。论文首先研究了代谢网络的全局拓扑特征。提出了一个展开的蝴蝶结模型,对代谢网络的宏观的蝴蝶结结构给出了清晰的可视化。该模型所揭示的拓扑模式有助于设计专门针对代谢网络的更有效的算法。这个粗粒化的图还使网络中的脆弱连接可视化,这有可能对疾病研究和药靶识别有着重要的意义。通过对代谢网络蝴蝶结结构的进一步研究发现,蝴蝶结的中心结(knot)富集双向连接,并含有一个紧致连接的主核(main core)。而且,三个重要代谢途径—糖酵解(glycolysis),三羧酸循环(tricarboxylic acid ,TCA)和戊糖磷酸循环(pentose phosphate pathway)占主核中代谢的大多数。该特征说明蝴蝶结结构在保持代谢系统的稳健性上具有功能意义。然后着重研究代谢网络的模块化拓扑特征。论文从以下两方面展开研究。一方面,研究代谢网络中嵌套蝴蝶结式的等级模块化(hierarchical modularity)结构特征。论文提出一个算法,基于代谢网络宏观的蝴蝶结结构,将代谢网络分解为子网络。对三个微生物(大肠杆菌Escherichia coli,嗜热泉生古细菌Aeropyrum pernix和酵母Saccharomyces cerevisiae)代谢网络的分解结果显示,几乎所有子网络呈现与全网络相似的蝴蝶结拓扑模式。这些小的蝴蝶结再逐层嵌套形成更大的蝴蝶结,最后整合成一个大的代谢网络。而随机网络并没有这种重要的模块化特征。而且,大多数蝴蝶结拓扑模块同时也是功能模块。另外,这种蝴蝶结模式还出现在一些化学上独立或空间上孤立的功能模块中,如碳代谢、细胞液内代谢、线粒体内代谢。这项研究说明,这种高度模块化的蝴蝶结结构模式出现在代谢网络的不同水平和不同等级上,以及不同的化学和空间功能模块中,这种现象更可能是进化的结果而非随机现象。此结果有助于理解代谢网络的设计原理并促进代谢系统的建模。另一方面,以人类(Homo sapiens)代谢网络为例,研究了代谢网络的核心-外周模块化(core-periphery modularity)特征。本论文用模拟退火法分解该网络,发现它的组织结构是一种高度模块化的核心-外周连接模式,其中核心模块间紧密连接并执行基础代谢功能,而外周模块只与极少的模块连接并完成相对独立和专一的功能。而且,半数以上的模块具有协同进化(co-evolution)的特征并属于特定的进化年代。外周模块比核心模块具有更强的协同进化性和更快的进化速率。这种系统水平的分析将基因的进化置于全基因组网络的背景下,对分子进化提出了新的观点。总之,本论文的研究揭示了代谢网络的拓扑结构与其功能和进化之间的关系,说明代谢系统的进化历史和功能需求已在代谢网络的拓扑结构上留下烙印。此研究对于更全面地理解代谢网络的结构、功能和进化起着积极的推动作用。