基于蛋白网络聚类的基因功能研究

基于蛋白网络聚类的基因功能研究

论文摘要

后基因组时代,功能基因组学研究的目标就是破译基因的功能并控制它们。由于具有相互作用的蛋白质趋向于有相似的细胞功能,可以利用最新的蛋白相互作用网络实验数据和其他大规模蛋白组数据,从系统生物学的角度出发,采用“相互作用->网络->功能”的新思路,通过比较已知和未知基因来类推蛋白的可能机能。本文从网络可视化、含时空的多数据源的聚类、蛋白模块化聚类等切入点入手,提出图聚类的新算法,解决蛋白功能分析的实际问题,采用多种评价方法对国际上和我们新开发的聚类方法进行综合评估,最终把聚类方法研究和可视化软件开发结合起来,对出芽酵母蛋白功能进行综合研究。本文提出了一种简单但信息丰富的手段来整合蛋白网络的拓扑信息和生物信息对网络进行可视化。在我们的方法中,可以很好地把如准团和“辐条状”团通过一棵聚类树显示出来,同时可以把从蛋白功能注释到相互作用的相关性图谱等注释到根据树的顺序表示的矩阵表示上,与以往的聚类方法相比,我们聚类算法ADJW既能很好的反映蛋白相互作用网络的拓扑性质,又富含有意义的生物信息,并且很适合矩阵可视化,是一种适合网络可视化的聚类算法。本文提出了一个简单而有效的层次聚类算法整合高通量的数据来研究生物网络的系统和动力学性质,可以有效的揭示酵母蛋白-蛋白相互作用网络中的模块化结构,通过整合的高通量蛋白相互作用和相关的亚细胞定位组数据及表达谱数据区分蛋白复合物和蛋白功能模块。此外,我们的检测模块的方法为在模块中的没有注释功能的蛋白提供了一种研究蛋白功能的背景信息。另一方面,整合各方面的蛋白相关信息可以使我们的方法对数据(特别是复合物)的假阳性具有更高的鲁棒性。本文打破了传统的基于蛋白间相似度的聚类模式,直接从蛋白功能团的角度出发,考虑功能团间的一阶和二阶相互作用,提出了模块化聚类方法(MCM),对实验数据进行聚类分析,来预测模块内未知蛋白的功能。通过超几何分布P值法和增、删、改相互作用的方法对聚类结果进行预测能力分析和稳定性分析。结果表明模块化聚类方法具有较高的预测准确度和覆盖率,有很好的容错性和稳定性。此外,模块化聚类分析得到了一些具有高预测准确度的未知蛋白的预测结果,将会对生物实验有指导意义,其算法对其它的具有相似结构的网络也具有普遍意义。本文设计了适合网络可视化的聚类软件,该软件集成了蛋白网络常用的聚类算法,采用矩阵显示和传统显示相结合的方式进行蛋白网络可视化,结合蛋白功能信息和其它相关生物学信息,为生物学家提供一个跨系统的蛋白相互作用网络分析平台。另外,我们还采用图论中谱分析的研究方法来揭示复杂的蛋白-蛋白相互作用

论文目录

  • 摘要
  • 图目录
  • 表目录
  • 第一章 绪论
  • 1.1 课题研究意义
  • 1.2 基因功能的生物信息学研究
  • 1.2.1 传统的推断基因功能的方法
  • 1.2.2 系统生物学观点下的基因功能研究
  • 1.2.3 用蛋白网络进行基因功能研究
  • 1.3 课题目标和内容
  • 1.4 本文的工作与组织
  • 第二章 蛋白相互作用网络介绍
  • 2.1 蛋白相互作用预测
  • 2.2 蛋白相互作用实验数据及其它大规模数据
  • 2.3 对数据质量的评估和高质量数据的筛选
  • 2.4 蛋白网络整体拓扑结构研究
  • 2.5 多物种的蛋白网络比较研究
  • 2.6 蛋白功能模块研究和功能预测
  • 第三章 网络拓扑聚类研究介绍
  • 3.1 聚类问题的一般描述
  • 3.2 向量空间中聚类
  • 3.2.1 向量空间中样本的距离和相似度
  • 3.2.2 向量空间中类间的距离定义
  • 3.2.3 向量空间中聚类
  • 3.3 蛋白网络聚类
  • 3.3.1 蛋白网络中的层次聚类
  • 3.3.2 小结
  • 第四章 蛋白网络谱分析研究
  • 4.1 介绍
  • 4.2 方法
  • 4.2.1 谱分析
  • 4.2.2 拓扑性质的识别
  • 4.2.3 给准团赋予功能和准团的 P 值
  • 4.3 结果
  • 4.3.1 数据源和分析
  • 4.3.2 对准团的注释
  • 4.3.3 对准团中未知功能蛋白的功能预测
  • 4.4 讨论
  • 第五章 适合网络可视化的聚类研究
  • 5.1 引言
  • 5.2 材料和方法
  • 5.2.1 数据源
  • 5.2.2 方法
  • 5.3 结果
  • 5.4 讨论
  • 第六章 整合时空信息的聚类研究
  • 6.1 背景
  • 6.2 结果
  • 6.3 讨论
  • 6.4 结论
  • 6.5 方法
  • 6.5.1 数据源
  • 6.5.2 层次聚类算法
  • 6.5.3 比较和验证
  • 第七章 基于功能模块的聚类研究
  • 7.1 背景
  • 7.2 材料和方法
  • 7.2.1 材料
  • 7.2.2 算法
  • 7.2.3 功能团的评测参数P 值
  • 7.3 结果
  • 7.4 讨论
  • 第八章 可视化软件PINC 设计
  • 8.1 目标和功能设计
  • 8.2 模块划分
  • 第九章 总结和展望
  • 9.1 本文工作总结
  • 9.2 下一步研究方向
  • 附录 SARS 冠状病毒的起源日期研究
  • 背景
  • 方法
  • 结果
  • 讨论
  • 结论
  • 附加证明
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].国际水稻功能基因组大会聚焦“绿色超级稻”[J]. 粮食科技与经济 2015(05)
    • [2].功能基因组与绿色超级稻[J]. 分子植物育种 2010(06)
    • [3].功能基因组技术在昆虫抗药性研究中的应用展望[J]. 植物保护学报 2020(02)
    • [4].863课题“家蚕驯化性状的功能基因组研究”启动会召开[J]. 蚕学通讯 2013(03)
    • [5].“863”动植物功能基因组课题中期检查[J]. 蚕学通讯 2008(03)
    • [6].非模式细菌功能基因组获取策略比较[J]. 基因组学与应用生物学 2017(07)
    • [7].马运动功能基因组初探[J]. 畜牧兽医科技信息 2015(10)
    • [8].人类功能基因组研究与开发的进展及对策建议[J]. 北京大学学报(医学版) 2009(03)
    • [9].持续推进小麦等作物功能基因组研究与应用 提升我国农业产业育种效率[J]. 中国农业科技导报 2016(06)
    • [10].“十一五”863计划“基于功能基因组和结构基因组的药物分子设计”重点项目课题布局及实施情况分析[J]. 中国生物工程杂志 2012(01)
    • [11].科技[J]. 种业导刊 2015(06)
    • [12].脑功能基因组的中医学探讨[J]. 中华中医药学刊 2008(11)
    • [13].功能基因组资源研究进展概述[J]. 生物学教学 2012(06)
    • [14].水稻养分利用功能基因组研究进展[J]. 生命科学 2016(10)
    • [15].“特色林木功能基因组研究与应用”项目获国家“863”计划资助[J]. 浙江农林大学学报 2013(04)
    • [16].“七大农作物育种”重点专项“水稻功能基因组研究与应用”项目召开2019年工作推进会[J]. 中国农业科技导报 2019(05)
    • [17].基因组编辑技术在水稻功能基因组和遗传改良中的应用[J]. 生命科学 2016(10)
    • [18].科研人员发现调控植物叶型发育分子机制[J]. 种业导刊 2017(05)
    • [19].简讯[J]. 蚕业科学 2014(02)
    • [20].中国水稻功能基因组研究进展与展望[J]. 科学通报 2015(18)
    • [21].棉花功能基因组研究进展[J]. 棉花学报 2017(S1)
    • [22].蛋白质组学技术的发展及其在肉质研究中的应用[J]. 畜牧与饲料科学 2012(02)
    • [23].沈阳农业大学2010年柞蚕功能基因组研究取得丰硕成果[J]. 广东农业科学 2011(02)
    • [24].基于功能基因组数据整合方法研究前列腺癌风险基因[J]. 现代生物医学进展 2012(31)
    • [25].谷子分子标记与功能基因组研究进展[J]. 中国农业科技导报 2009(04)
    • [26].文摘和文题[J]. 药物生物技术 2009(03)
    • [27].基于Miseq测序技术分析不同元胡产区土壤细菌功能基因组成与差异[J]. 浙江中医药大学学报 2018(03)
    • [28].西南大学家蚕基因组生物学国家重点实验室承担的两个863课题获准立项[J]. 蚕学通讯 2012(04)
    • [29].实时定量PCR芯片——功能基因组研究的有用工具[J]. 生命科学 2009(02)
    • [30].DNA芯片和表达谱在水稻功能基因组学中的应用[J]. 农家参谋 2018(09)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    基于蛋白网络聚类的基因功能研究
    下载Doc文档

    猜你喜欢