基于复杂网络的疾病基因预测的研究

基于复杂网络的疾病基因预测的研究

论文摘要

近年来,识别疾病的相关基因成为生命科学领域富有挑战性的工作之一。传统的预测疾病基因的方法有连锁分析(Linkage Analysis)和关联研究(Association Study)。但是连锁分析方法只能定位染色体上的一段区域,这段区域包含几十个到几百个基因。同时关联研究也需要明确候选基因。各国研究人员陆续的提出对这段区域的候选基因进行进一步筛选的方法。人类基因组计划(Human Genome Project, HGP)的完成和高通量生物技术的产生,我们获取了大规模的人类蛋白质交互作用数据(Protein-Protein Interaction, PPI)。有研究表明,在PPI网络上,具有较高拓扑重叠的蛋白质共属于一个生物功能模块或生物通路的可能性就越大。基于此,本文中,我们提出了基于PPI网络的对疾病候选基因进行预测的方法MTOM&ATOM。此方法结合多点拓扑重叠法(Multi-node Topology Overlap Measure, MTOM)和两点拓扑重叠法(Averaged Topology Overlap Measure, ATOM)。MTOM&ATOM方法是通过衡量网络节点间拓扑重叠性大小来反映网络节点间的相似性,是一个更能反映生物意义的网络距离度量法。我们把该方法在包含783个基因的110类疾病-基因家族中进行50-fold留一法交叉验证,发现enrichment达到27-fold, roc曲线下面积为92.3%,取得了与同类方法相比较好的效果。我们把MTOM&ATOM方法应用于阿尔茨海默氏病(Alzheimer’s Disease,AD)相关基因的发现研究。首先,在kohler等人构建的PPI网络上进行预测分析,取得了跟kohler等人提出来的全局度量法随机游走相同的效果。其次,基于刘等人提出来的脑特异网络进行AD基因的预测,前46个分值最高的基因中,有40个与AD相关联的基因,比刘等人的预测结果稍好。MTOM&ATOM方法复杂度低,运算速度快,并且对网络的不完整性和连接的假阳性有较强的鲁棒性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 本文的主要研究内容
  • 1.2.1 基于复杂网络的疾病基因预测
  • 1.3 本文的主要贡献
  • 1.4 本文的组织结构
  • 第2章 背景知识及疾病研究现状
  • 2.1 引言
  • 2.1.1 单基因病
  • 2.1.2 复杂疾病
  • 2.2 疾病基因预测的传统方法
  • 2.2.1 连锁分析
  • 2.2.2 关联研究
  • 2.3 疾病基因预测的生物信息学方法
  • 2.3.1 基于序列特征
  • 2.3.2 基于表达模式
  • 2.3.3 基于功能注释
  • 2.3.4 文本描述
  • 2.3.5 基于PPI网络
  • 2.4 小结
  • 第3章 基于MTOM&ATOM的疾病基因预测方法及验证
  • 3.1 引言
  • 3.2 网络距离度量方法
  • 3.2.1 两点之间的拓扑重叠
  • 3.2.2 多种子点拓扑重叠法
  • 3.2.3 MTOM&ATOM方法
  • 3.3 方法验证
  • 3.3.1 数据集
  • 3.3.2 方法比较
  • 3.3.3 效果评价标准
  • 3.3.4 预测结果比较
  • 3.4 总结与讨论
  • 3.5 小结
  • 第4章 基于MTOM&ATOM的AD基因预测
  • 4.1 引言
  • 4.2 数据集
  • 4.3 AD相关基因预测
  • 4.4 AD疾病基因预测结果
  • 4.4.1 基于PPI-kohler网络数据
  • 4.4.2 基于NET-LIU网络数据
  • 4.5 结论与讨论
  • 4.6 小结
  • 第5章 总结与讨论
  • 5.1 本文研究工作总结
  • 5.2 未来工作展望
  • 5.3 本章小结
  • 参考文献
  • 致谢
  • 作者简介
  • 附录
  • 相关论文文献

    • [1].健康生活方式或能减轻心脏疾病基因风险[J]. 心血管病防治知识(科普版) 2017(09)
    • [2].健康的密码藏在生活方式里[J]. 家族企业 2020(04)
    • [3].基于功能相似性预测疾病基因[J]. 计算机应用研究 2012(11)
    • [4].基于分子网络的疾病基因预测方法综述[J]. 电子科技大学学报 2017(05)
    • [5].基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J]. 生物物理学报 2014(01)
    • [6].利用相似显著性序列特征预测白血病疾病基因[J]. 华中师范大学学报(自然科学版) 2012(04)
    • [7].基于表达及网络拓扑结构挖掘动脉粥样硬化风险疾病基因[J]. 生物化学与生物物理进展 2010(08)
    • [8].基于序列特征预测先天性糖基化紊乱疾病基因[J]. 华中科技大学学报(自然科学版) 2009(08)
    • [9].基于网络方法的疾病基因预测算法分析[J]. 宝鸡文理学院学报(自然科学版) 2017(01)
    • [10].基于文本挖掘与功能相似性的疾病基因预测[J]. 计算机工程 2011(04)
    • [11].关于心脏疾病基因检测的最新动态[J]. 心血管病防治知识(科普版) 2013(05)
    • [12].原发性开角型青光眼疾病基因的研究进展[J]. 国际眼科杂志 2008(07)
    • [13].冠状动脉疾病基因谱分析[J]. 中国介入心脏病学杂志 2008(05)
    • [14].基因破译将带来哪些改变[J]. 健康生活 2008(06)
    • [15].PCR技术在疾病基因检测方面应用进展[J]. 齐齐哈尔医学院学报 2018(21)
    • [16].基于信息熵的加权基因关联网络融合方法[J]. 电子科技大学学报 2018(02)
    • [17].蝴蝶效应与检验技术[J]. 黑龙江科技信息 2014(27)
    • [18].心脏性猝死相关疾病基因检测与心电学[J]. 实用心电学杂志 2015(06)
    • [19].基于功能的疾病基因预测系统设计与应用[J]. 计算机工程 2010(12)
    • [20].科技短波[J]. 新农村 2019(03)
    • [21].科学家筛选出小麦抗真菌疾病基因[J]. 种业导刊 2009(03)
    • [22].科学家筛选出小麦抗真菌疾病基因[J]. 北京农业 2009(08)
    • [23].通过文本挖掘获取疾病相关功能信息[J]. 微计算机信息 2009(36)
    • [24].科学家筛选出小麦抗真菌疾病基因[J]. 中国植保导刊 2009(05)
    • [25].基于HeteSim的疾病关联长非编码RNA预测[J]. 计算机研究与发展 2019(09)
    • [26].科学家筛选出小麦抗真菌疾病基因[J]. 农药市场信息 2009(10)
    • [27].海南醫學院黎族研究[J]. 海南医学院学报 2012(09)
    • [28].疾病 并非全是害[J]. 中华养生保健 2010(03)
    • [29].Toppgene筛选肺腺癌候选疾病基因[J]. 中国肺癌杂志 2010(04)
    • [30].基于文本的人类疾病基因网络的重构和分析[J]. 黑龙江科技信息 2011(27)

    标签:;  ;  ;  ;  

    基于复杂网络的疾病基因预测的研究
    下载Doc文档

    猜你喜欢