蛋白质网络中复合物和功能模块挖掘算法研究

蛋白质网络中复合物和功能模块挖掘算法研究

论文摘要

在后基因组时代,一个重要的挑战就是系统地分析和全面理解蛋白质之间是如何通过相互作用来完成生命活动的。从拓扑结构上分析蛋白质网络的特性,进而探寻蛋白质复合物和功能模块、注释未知蛋白质功能正成为当前国内外研究的重要焦点。本文从蛋白质网络拓扑特性分析出发,利用各物种蛋白质网络所具有的一些共性特征设计了有效的蛋白质复合物和功能模块识别算法,主要研究工作包括:应用复杂网络理论和图论技术对不同物种的蛋白质网络进行拓扑特性分析,包括节点的度分布、度与度的相关性、网络直径、网络的特征路径长度、边介数、边间隔以及网络的可靠性等,发现了不同物种的蛋白质网络的一些共性特征,为设计合理的蛋白质复合物和功能模块挖掘算法提供依据。针对目前能够获得的蛋白质相互作用数据还不完全,直接从蛋白质网络中挖掘完备的全连通图(极大团)来预测蛋白质复合物具有很大局限性这一事实,提出了一种基于极大团扩展的蛋白质复合物识别算法IPC-MCE。该算法不需要其它任何辅助信息,简单有效。将算法IPC-MCE应用于酵母蛋白质网络,实验结果表明其能够识别比较多的具有生物意义的蛋白质复合物,且对输入参数不敏感。基于对已知蛋白质复合物内蛋白质之间的最短距离一般不超过2的发现,提出了一种基于距离测定的蛋白质复合物识别算法IPC-DM。实验结果表明,算法IPC-DM较其它识别蛋白质复合物的聚类方法更能有效地标识已知蛋白质复合物,并且具有较高敏感度、特异性和综合评价。特别地,算法IPC-DM对蛋白质相互作用大规模数据中普遍存在的比例较高的假阳性和假阴性具有很好的健壮性,能够在蛋白质相互作用数据还不完善且具有较高噪声的情况下有效地识别蛋白质复合物,可以为生物学家进行蛋白质复合物识别的实验和进一步研究提供有价值的参考信息。针对基于介数的层次化聚类算法计算复杂度高,很难应用于大规模蛋白质网络的不足,引入了局部变量边聚集系数,提出了一种基于边聚集系数的快速层次聚类算法FAG-EC。为降低算法对噪声的敏感性,本文应用logistic回归模型对蛋白质相互作用的可靠性进行评估进而建立加权蛋白质网络,并定义了加权的边聚集系数和功能模块,提出了应用于加权网络的层次聚类算法HC-Wpin。基于GO数据库中生物过程、分子功能和细胞成分全部三种注释信息的验证评估结果表明,算法FAG-EC和HC-Wpin不仅能够有效识别蛋白质网络中具有生物意义的功能模块,并且可以通过修改参数取值来展示蛋白质网络中功能模块的层次化组织结构。此外,算法FAG-EC和HC-Wpin的运行效率非常高,随着大规模蛋白质相互作用数据的不断增加,可以应用于更大规模的蛋白质网络。针对蛋白质网络中普遍存在的“中心性-致死性”法则,提出了一个图分裂.规约模型,并在该模型基础上设计了一种新的交叠功能模块识别算法OMFinder。实验结果表明算法OMFinder能够有效地识别彼此交叠的功能模块,不同功能模块之间的重叠率约为2。与其他识别交叠功能模块的算法比较,算法OMFinder具有更好的识别性能,且具有更低的丢弃率。本文提出的几个聚类算法从不同角度出发,有效地解决了蛋白质网络聚类过程中存在的一些问题。本文提出的聚类算法不仅运行效率很高,而且具有很好的聚类效果,识别的蛋白质复合物或功能模块都从统计意义上被证明是有生物意义的,有效地预测了一定数量的未知蛋白质的功能,将会对生物实验有指导意义。此外,本文提出的聚类算法对其它具有相似结构的复杂网络也具有普遍意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 蛋白质网络
  • 1.2 课题的研究意义
  • 1.3 相关研究工作
  • 1.3.1 基于图划分的方法
  • 1.3.2 基于密度的局部搜索方法
  • 1.3.3 基于层次聚类的方法
  • 1.3.4 其他方法
  • 1.4 本文的主要研究内容
  • 1.5 论文的结构
  • 第二章 蛋白质网络拓扑及可靠性分析
  • 2.1 相关定义
  • 2.2 蛋白质网络拓扑分析
  • 2.2.1 蛋白质相互作用数据
  • 2.2.2 网络直径和特征路径长度分析
  • 2.2.3 节点度的分布特性
  • 2.2.4 节点介数及与节点度的相关性分析
  • 2.2.5 边介数和边间隔分析
  • 2.2.6 聚集系数与模块化结构分析
  • 2.3 蛋白质网络可靠性分析
  • 2.3.1 蛋白质网络可靠性的评价指标
  • 2.3.2 蛋白质网络可靠性分析
  • 2.4 本章小结
  • 第三章 基于极大团扩展的蛋白质复合物识别算法
  • 3.1 极大团扩展模型
  • 3.2 基于极大团扩展的算法 IPC-MCE
  • 3.3 实验结果与分析
  • 3.3.1 与MIPS数据库中的已知蛋白质复合物比较
  • 3.3.2 与系统分析得到的已知蛋白质复合物比较
  • 3.3.3 算法的特异性和敏感度
  • 3.3.4 功能富集分析
  • 3.4 本章小结
  • 第四章 基于距离测定的蛋白质复合物识别算法
  • 4.1 蛋白质复合物模型及相关定义
  • 4.1.1 已知蛋白质复合物拓扑分析
  • 4.1.2 基于距离测定的蛋白质复合物扩充模型
  • 4.2 基于距离测定的蛋白质复合物识别算法
  • 4.3 实验结果与分析
  • 4.3.1 参数设置对聚类结果的影响分析
  • 4.3.2 与MIPS数据库中的已知蛋白质复合物比较
  • 4.3.3 算法的特异性和敏感度
  • 4.3.4 功能富集分析
  • 4.3.5 健壮性分析
  • 4.3.6 算法的运行效率分析
  • 4.4 本章小结
  • 第五章 基于边聚集系数的快速层次聚类算法
  • 5.1 层次聚类算法FAG-EC
  • 5.1.1 边聚集系数的引入
  • 5.1.2 量化定义功能模块
  • 5.1.3 算法FAG-EC
  • 5.2 加权层次聚类算法HC-Wpin
  • 5.2.1 加权蛋白质网络
  • 5.2.2 算法HC-Wpin
  • 5.3 实验结果与分析
  • 5.3.1 参数设置对聚类结果的影响
  • 5.3.2 基于GO的P-value评估
  • 5.3.3 查全率和查准率分析
  • 5.3.4 算法的运行效率分析
  • 5.4 本章小结
  • 第六章 识别交叠功能模块的算法OMFinder
  • 6.1 中心性-致死性法则
  • 6.2 算法OMFinder
  • 6.3 实验结果与分析
  • 6.3.1 识别交叠的网络功能模块
  • 6.3.2 统计评估与功能注释
  • 6.3.3 查全率和查准率分析
  • 6.4 几种算法的比较分析
  • 6.5 本章小结
  • 第七章 总结
  • 7.1 主要贡献和创新点
  • 7.2 展望
  • 参考文献
  • 致谢
  • 攻读博士学位期间主要的研究成果
  • 相关论文文献

    • [1].2009计算生物与系统生物学国际会议[J]. 国际学术动态 2010(02)
    • [2].癌症系统生物学研究[J]. 国际学术动态 2013(01)
    • [3].2010计算生物与系统生物学国际会议[J]. 国际学术动态 2011(05)
    • [4].系统生物学——中西医结合的桥梁[J]. 中国中西医结合杂志 2019(12)
    • [5].不忘初心,勇攀系统生物学研究高峰[J]. 科学新闻 2020(02)
    • [6].基于系统生物学的研究新策略在中医皮肤科的应用[J]. 中国中西医结合皮肤性病学杂志 2019(05)
    • [7].吸烟可以改变DNA甲基化[J]. 开卷有益-求医问药 2017(06)
    • [8].癌症系统生物学[J]. 国际学术动态 2016(04)
    • [9].长春系统生物学国际研讨会[J]. 国际学术动态 2008(04)
    • [10].系统生物学的方案并不适合于中医[J]. 医学争鸣 2019(02)
    • [11].浅议用系统生物学研究抗癌药物[J]. 现代经济信息 2017(14)
    • [12].外国杂志称用系统生物学研究中医药潜力巨大[J]. 前进论坛(健康中华) 2008(01)
    • [13].犬类研究的新角度——系统生物学[J]. 中国工作犬业 2011(08)
    • [14].“癌症与系统生物学”国际研讨会[J]. 华西医学 2010(02)
    • [15].系统生物学技术在口腔癌诊断中的应用[J]. 临床口腔医学杂志 2010(06)
    • [16].计算系统生物学:理论、方法及在药物研发中的应用[J]. 生命科学 2010(10)
    • [17].心血管系统生物学研究进展[J]. 生理科学进展 2009(02)
    • [18].慢性乙型肝炎证候系统生物学的研究思路与方法[J]. 中华中医药学刊 2009(06)
    • [19].中医药系统生物学发展及展望[J]. 中国天然药物 2009(04)
    • [20].系统生物学将推动中药复杂体系的深入研究[J]. 中国天然药物 2009(04)
    • [21].中科院上海生命科学研究院-安捷伦系统生物学中心揭牌[J]. 生命科学仪器 2009(07)
    • [22].工科院校系统生物学教学改革初探[J]. 教育教学论坛 2019(04)
    • [23].孤阴不生,独阳不长-系统生物学助推中医学发展的可行性分析及策略[J]. 中西医结合心血管病电子杂志 2019(05)
    • [24].系统生物学在疫苗研究中的应用[J]. 临床医药文献电子杂志 2018(31)
    • [25].系统生物学技术在微生物菌种改良中的应用[J]. 化工科技 2009(01)
    • [26].化学能为系统生物学与合成生物学贡献什么?[J]. 生物物理学报 2009(S1)
    • [27].系统生物学技术在解析细胞信号调控机制中的应用[J]. 微循环学杂志 2009(04)
    • [28].第三届全国生物信息学与系统生物学会议将在武汉召开[J]. 遗传 2008(08)
    • [29].开展跨学科学术交流,推动肿瘤信息学与系统生物学研究[J]. 国际学术动态 2015(03)
    • [30].应用现代科学语言讲好传统中医故事――《系统生物学在中医风湿病中的应用实践》评介[J]. 风湿病与关节炎 2019(10)

    标签:;  ;  ;  ;  ;  ;  

    蛋白质网络中复合物和功能模块挖掘算法研究
    下载Doc文档

    猜你喜欢