基于氨基酸使用偏好及基因功能信息预测疾病相关基因

基于氨基酸使用偏好及基因功能信息预测疾病相关基因

论文摘要

疾病基因的发现对于认识疾病机理、研制新的诊疗方法与设计新型药物起着重要的作用。随着人类基因组计划的完成,人们发现了大量的潜在的和疾病相关的基因,对这些疾病候选基因进行预测和辨别就成为后基因组时代的一个重要任务。人们已经发展了多种基于计算的疾病基因预测方法,但是这些方法都存在各自的缺陷,比如基于序列特征的方法通常仅考虑所有的疾病基因和正常基因在序列特征上的差异,对不同的疾病的特有性质并没有加于区分;而基于功能的方法只依赖于具有相同功能基因的信息,没有考虑功能之间的关联性以及不同功能对同种疾病的贡献程度。本文首先对OMIM中具有已知疾病基因个数不小于2的疾病进行了分析,发现在Ehlers-Danlos综合症等60种疾病中,导致同一种疾病的致病基因的氨基酸使用存在较显著的疾病特异性,即同种疾病的致病基因编码蛋白质的氨基酸使用频率分布非常相似。进一步,使用这60种疾病致病基因各自的序列特征,构建疾病特异的模型,改进了基于序列特征的疾病基因预测方法。最终的leave-one-out交叉验证结果表明,被预测出排在定位区间所有候选基因第1位的基因中,有超过16%被证实为真实的疾病基因,其预测效能优于同类软件PROSPECTR。此外,本文还开发了一种新的基于距离来计算基因功能相似性的疾病基因预测工具CDGMiner,它利用GO术语在DAG中的最短路径的距离来挖掘候选基因和已知疾病基因的GO之间的相似性,并根据GO注释对同一种疾病的贡献程度加以权重,对已经定位到某个染色体区间的疾病的候选致病基因进行打分排序。利用OMIM中的疾病数据集对CDGMiner进行测试,56.7%的疾病基因在候选基因可以被预测到前5%,总体性能略优于国际同类方法。同时还利用CDGMiner对80种癌症的292个致癌基因进行分析,其预测性能与专门用于癌基因预测的软件CGP相当。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题来源
  • 1.2 研究背景、目的、意义
  • 1.3 国内外研究现状
  • 1.4 主要研究工作
  • 2 基于序列特征的疾病基因预测
  • 2.1 研究数据的获取
  • 2.1.1 疾病基因数据
  • 2.1.2 对照数据
  • 2.1.3 测试数据
  • 2.2 氨基酸使用特征
  • 2.2.1 氨基酸使用特征的计算方法
  • 2.2.2 疾病特异氨基酸使用特征
  • 2.3 基于氨基酸使用特征预测疾病基因
  • 2.3.1 疾病基因预测方法
  • 2.3.2 预测精度及其与同类方法的比较
  • 2.4 结果讨论
  • 2.5 本章小结
  • 3 基于基因产物功能信息的疾病基因预测
  • 3.1 基因功能与疾病关联及相关性评价方法
  • 3.2 基于GO 间最短路径的的疾病基因预测
  • 3.2.1 基因功能与疾病的相关度
  • 3.2.2 预测框架
  • 3.2.3 预测精度及其与同类软件的比较
  • 3.2.4 讨论与结论
  • 3.3 在癌基因预测中的应用
  • 3.3.1 癌基因功能特点
  • 3.3.2 利用CDGMiner 预测
  • 3.3.3 同类工具的比较
  • 3.4 本章小结
  • 4 总结与展望
  • 4.1 总结
  • 4.2 展望
  • 致谢
  • 参考文献
  • 附录攻读学位期间发表论文目录
  • 相关论文文献

    • [1].健康生活方式或能减轻心脏疾病基因风险[J]. 心血管病防治知识(科普版) 2017(09)
    • [2].健康的密码藏在生活方式里[J]. 家族企业 2020(04)
    • [3].基于功能相似性预测疾病基因[J]. 计算机应用研究 2012(11)
    • [4].基于分子网络的疾病基因预测方法综述[J]. 电子科技大学学报 2017(05)
    • [5].基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J]. 生物物理学报 2014(01)
    • [6].利用相似显著性序列特征预测白血病疾病基因[J]. 华中师范大学学报(自然科学版) 2012(04)
    • [7].基于表达及网络拓扑结构挖掘动脉粥样硬化风险疾病基因[J]. 生物化学与生物物理进展 2010(08)
    • [8].基于序列特征预测先天性糖基化紊乱疾病基因[J]. 华中科技大学学报(自然科学版) 2009(08)
    • [9].基于网络方法的疾病基因预测算法分析[J]. 宝鸡文理学院学报(自然科学版) 2017(01)
    • [10].基于文本挖掘与功能相似性的疾病基因预测[J]. 计算机工程 2011(04)
    • [11].关于心脏疾病基因检测的最新动态[J]. 心血管病防治知识(科普版) 2013(05)
    • [12].原发性开角型青光眼疾病基因的研究进展[J]. 国际眼科杂志 2008(07)
    • [13].冠状动脉疾病基因谱分析[J]. 中国介入心脏病学杂志 2008(05)
    • [14].基因破译将带来哪些改变[J]. 健康生活 2008(06)
    • [15].PCR技术在疾病基因检测方面应用进展[J]. 齐齐哈尔医学院学报 2018(21)
    • [16].基于信息熵的加权基因关联网络融合方法[J]. 电子科技大学学报 2018(02)
    • [17].蝴蝶效应与检验技术[J]. 黑龙江科技信息 2014(27)
    • [18].心脏性猝死相关疾病基因检测与心电学[J]. 实用心电学杂志 2015(06)
    • [19].基于功能的疾病基因预测系统设计与应用[J]. 计算机工程 2010(12)
    • [20].科技短波[J]. 新农村 2019(03)
    • [21].科学家筛选出小麦抗真菌疾病基因[J]. 种业导刊 2009(03)
    • [22].科学家筛选出小麦抗真菌疾病基因[J]. 北京农业 2009(08)
    • [23].通过文本挖掘获取疾病相关功能信息[J]. 微计算机信息 2009(36)
    • [24].科学家筛选出小麦抗真菌疾病基因[J]. 中国植保导刊 2009(05)
    • [25].基于HeteSim的疾病关联长非编码RNA预测[J]. 计算机研究与发展 2019(09)
    • [26].科学家筛选出小麦抗真菌疾病基因[J]. 农药市场信息 2009(10)
    • [27].海南醫學院黎族研究[J]. 海南医学院学报 2012(09)
    • [28].疾病 并非全是害[J]. 中华养生保健 2010(03)
    • [29].Toppgene筛选肺腺癌候选疾病基因[J]. 中国肺癌杂志 2010(04)
    • [30].基于文本的人类疾病基因网络的重构和分析[J]. 黑龙江科技信息 2011(27)

    标签:;  ;  ;  ;  

    基于氨基酸使用偏好及基因功能信息预测疾病相关基因
    下载Doc文档

    猜你喜欢