代谢网络中功能模块挖掘和进化分析研究

代谢网络中功能模块挖掘和进化分析研究

论文摘要

在后基因组时代,随着数百个物种的全基因组测序的完成以及基因组注释信息的日益完善,可以较可靠地从基因组信息重建物种特异的代谢网络。系统地分析代谢通路和代谢物之间如何作用,将有助于理解和利用细胞的代谢过程,并能促进发酵技术和医药工程的发展;对进化过程中不同物种代谢网络拓扑结构的分析和比较,可以帮助我们了解生命进化的历史和规律。因此从拓扑结构上分析代谢网络的特性,进而分解代谢网络、发现功能模块和保守模式、推算进化距离等研究正成为当前国内外本学科研究的重要课题。本文从研究代谢网络拓扑特性和节点中心性出发,运用复杂网络理论、图论和数学方法,对代谢网络中功能模块挖掘和进化分析进行了深入研究,主要研究工作和成果包括:应用复杂网络理论和图论技术对不同物种的代谢网络进行拓扑特征分析和节点中心性分析,包括节点的度分布、聚集系数和特征路径长度等参数,发现不同物种代谢网络的一些共性特征,为设计更好的代谢网络分解、比较、挖掘算法提供依据。针对大多数层次聚类算法无法识别实际复杂网络中存在的交叠模块这一缺陷,提出了一种度量模块间连通性的指标,并在此基础上设计了一种发现交叠模块的快速层次化算法F-HOC。将F-HOC算法与目前可以发现交叠模块的层次化算法进行比较,实验结果表明对于社团结构明显的复杂网络,该算法具有更好的敏感度,更高的运行效率。随着大规模网络数据的不断增加,该算法的运行时间增长幅度不大,比目前可以发现交叠社团的层次化算法更适合应用于大规模的复杂网络。为了可以从整个网络的角度实现对代谢通路的分析,并避免组合爆炸问题,在F-HOC的基础上提出了基于社团连通性的代谢网络分解算法CMD。该方法根据代谢网络的拓扑特性对F-HOC进行改进,可以识别出代谢网络边缘的单条长路径。将算法应用到E.coli代谢网络的分解中,实验结果表明此算法不仅能够有效识别交叠的功能模块,较准确地标识出数据库中的代谢通路,还可以通过自底向上的合并过程来体现层次化组织结构的功能模块,同时不会遗漏网络中的边缘长路径。针对以往集合论的网络比较方法仅考虑节点本身的特性这一缺陷,本文提出了一种全新的整体网络比较方法MWD,能同时考虑到节点在网络拓扑结构属性方面的差异。该方法采用主成分分析和小波变换的方法来比较代谢网络,计算相似度,由此推算出两物种间的进化距离。应用MWD方法分析109个物种网络间的相似度,结果表明该算法能有效地比较网络,借助比较结果,可以揭示代谢网络的物种特异性,并为代谢网络的进化研究提供数学基础;将该方法计算出来的各个物种与模式生物的进化距离,与用集合论的方法计算出来的Jaccard距离进行比较,结果显示用该方法计算出来的误差较小,说明了该方法的合理性。针对基于Apriori思想的频繁子图挖掘算法计算复杂度高,很难应用于大规模代谢网络的不足,本文提出了挖掘代谢网络的闭合频繁子图算法MaxFP,用于发现代谢网络的保守模式。此算法与基于Apriori的频繁子图挖掘算法进行比较,实验结果证明此算法的运行效率非常高,并且能找到更多的具有生物意义的频繁子图。论文有效地解决了代谢网络中结构与功能、进化关系研究中存在的一些问题。提出的算法不仅运行效率较高,而且其结果从统计意义上被证明具有较强的生物意义,对生物相关实验和研究具有一定的指导意义。此外,论文提出的算法对其他具有相似结构的复杂网络也具有普遍意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 代谢网络
  • 1.1.1 代谢数据库资源
  • 1.1.2 代谢网络建模
  • 1.2 课题的研究意义
  • 1.3 相关的研究工作
  • 1.3.1 代谢网络的重构
  • 1.3.2 代谢网络的分解方法
  • 1.3.3 代谢网络的进化距离研究
  • 1.3.4 代谢网络保守模式挖掘研究
  • 1.4 论文的主要研究内容
  • 1.5 论文的结构
  • 第二章 发现交叠社团的快速层次化算法
  • 2.1 复杂网络概述
  • 2.1.1 复杂网络的拓扑结构特性
  • 2.1.2 社团发现算法
  • 2.2 发现交叠社团的快速层次化算法F-HOC
  • 2.3 实验结果与分析
  • 2.3.1 算法的精度
  • 2.3.2 算法的运行效率
  • 2.3.3 交叠点的识别度
  • 2.5 本章小结
  • 第三章 基于社团连通性的代谢网络分解算法
  • 3.1 数据准备与网络重构
  • 3.2 代谢网络的拓扑特征分析
  • 3.2.1 度分布与无标度性
  • 3.2.2 聚集系数与模块性
  • 3.2.3 特征路径长度与小世界性
  • 3.3 基于社团连通性的代谢网络分解算法CMD
  • 3.4 实验结果与分析
  • 3.4.1 参数设置对结果的影响
  • 3.4.2 算法的敏感度和特异性
  • 3.4.3 与代谢网络数据库中已知功能模块比较分析
  • 3.5 本章小结
  • 第四章 代谢网络节点中心性分析及网络比较方法
  • 4.1 代谢网络的节点中心性
  • 4.2 主成分分析
  • 4.2.1 选取主成分
  • 4.2.2 主成分数据的序列化
  • 4.3 小波分析与相似性比较
  • 4.3.1 小波分析
  • 4.3.2 主成分特征相似性
  • 4.4 基于主成分分析和小波变换的代谢网络比较方法MWD
  • 4.5 实验
  • 4.5.1 实验设计
  • 4.5.2 实验结果及分析
  • 4.5.3 与模式生物的进化距离比较分析
  • 4.6 本章小结
  • 第五章 代谢网络闭合频繁子图挖掘算法
  • 5.1 相关知识
  • 5.1.1 图同构及子图同构
  • 5.1.2 频繁子图挖掘
  • 5.2 模型及问题描述
  • 5.3 闭合频繁子图高效挖掘算法MaxFP
  • 5.3.1 FP-树
  • 5.3.2 MaxFP算法
  • 5.3.3 数据后处理
  • 5.4 实验结果与分析
  • 5.5 本章小结
  • 第六章 总结
  • 6.1 主要贡献和创新点
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间主要的研究成果
  • 相关论文文献

    • [1].炎症性肠病肠道微生物整合代谢网络的构建与分析[J]. 军事医学 2019(07)
    • [2].基于支持向量机的代谢网络特征分析[J]. 计算机光盘软件与应用 2012(04)
    • [3].微生物基因组尺度代谢网络模型构建方法的比较分析[J]. 生物数学学报 2018(02)
    • [4].物质代谢网络中葡萄糖有氧分解途径的主干道作用分析及课堂教学[J]. 高师理科学刊 2019(01)
    • [5].基于酶约束的代谢网络模型研究进展及其应用[J]. 生物工程学报 2019(10)
    • [6].基因组规模代谢网络模型的约束算法及其应用[J]. 生物加工过程 2012(06)
    • [7].基因组规模代谢网络模型构建及其应用[J]. 生物工程学报 2010(09)
    • [8].白藜芦醇对大鼠代谢网络通量的影响[J]. 食品科学 2016(19)
    • [9].由代谢网络分析发现菌种代谢工程改造新策略[J]. 化工进展 2017(12)
    • [10].一种基于代谢网络分析最小化基因组的方法及其在大肠杆菌中的应用[J]. 生物工程学报 2013(08)
    • [11].大尺度代谢网络通量平衡分析的进展与应用[J]. 化学工业与工程 2013(03)
    • [12].全基因组范围代谢网络的构建和最小基因组研究[J]. 生命科学 2011(09)
    • [13].产电微生物基因组及代谢网络分析[J]. 应用与环境生物学报 2012(06)
    • [14].应用代谢网络模型解析工业微生物胞内代谢[J]. 生物工程学报 2019(10)
    • [15].运用COBRA方法研究聚球藻代谢网络[J]. 贵州师范大学学报(自然科学版) 2019(03)
    • [16].浅谈物质代谢网络的交汇点——mTOR[J]. 生命的化学 2017(02)
    • [17].中国科学院遗传所解析黄瓜挥发性物质代谢网络[J]. 蔬菜 2016(10)
    • [18].基因组尺度代谢网络模型在生物质燃料产生菌改造中的应用[J]. 基因组学与应用生物学 2016(03)
    • [19].黑曲霉组学研究进展[J]. 生物工程学报 2016(08)
    • [20].基于小组合作构建代谢网络的翻转课堂教学实践研究——以《生物化学》课程中的甘油三酯代谢内容为例[J]. 生命的化学 2018(04)
    • [21].Helicobacter pylori 26695基因组尺度代谢研究进展[J]. 生物信息学 2014(03)
    • [22].基于文献挖掘的巨大芽胞杆菌代谢网络模型的构建与分析[J]. 微生物学报 2012(04)
    • [23].基于Matlab对解脂耶氏酵母基因组规模代谢网络模型仿真结果的可视化分析[J]. 微生物学通报 2015(09)
    • [24].基因组水平上重构代谢网络的研究进展[J]. 药物生物技术 2012(02)
    • [25].基于RAST的离子束重组菌DOB981的代谢网络研究[J]. 基因组学与应用生物学 2017(10)
    • [26].用支持向量机对新陈代谢网络进行预测[J]. 科学中国人 2015(24)
    • [27].基于酶序列数据库的本地化构建及应用[J]. 贵州师范大学学报(自然科学版) 2017(01)
    • [28].代谢途径分析研究进展及其应用[J]. 计算机工程与应用 2009(33)
    • [29].乳酸乳球菌NZ9000基因组规模代谢网络模型的构建与验证[J]. 生物工程学报 2020(08)
    • [30].如何利用全基因组模型预测生物功能[J]. 中国农业科技导报 2015(03)

    标签:;  ;  ;  ;  ;  

    代谢网络中功能模块挖掘和进化分析研究
    下载Doc文档

    猜你喜欢