最大熵算法在SNP与疾病关联性研究的应用

最大熵算法在SNP与疾病关联性研究的应用

论文摘要

单核苷酸多态性(SNP)是一种由人类DNA的等位基因变异导致的DNA的多态性。医学研究证明,SNP与人类的许多疾病都有着密切的联系,对SNP与人类疾病之间的相关性进行研究能够提早发现可能在患者身上出现的潜在疾病,在医学研究上能够对一些疑难杂症的形成原因提供理论依据,在对威胁人类健康的重大疾病的预防与治疗提供更加深入的诊断方式。同时这一研究目前在世界范围尚属前沿领域,具有重大意义。本文研究了通过最大熵对SNP与疾病相关性建模的方法。针对实验数据中存在的小样本、信息交叉的情况,提出了bootstrap、稳定性计算及解交叉等数据处理方法,分析了各个方法的原理及实验中的作用,通过这些方法对实验数据进行数据扩展、稳定性计算、信息解交叉等工作。同时从理论上分析了最大熵方法在本文工作中的适用性,并利用最大熵方法建立SNP与疾病相关性的模型。通过对真实SNP样本数据进行实验,求解出每个SNP模型的致病概率,并利用测试样本对结果的性能进行评价。通过实验验证了bootstrap最大熵方法对SNP与疾病相关性模型的优化作用,对比解交叉前后的实验结果,验证了解交叉方法对实验性能的提升作用。对实验中出现的问题做了分析,指出了SNP与疾病相关性研究的下一步工作思路。

论文目录

  • 摘要
  • 英文摘要
  • 目录
  • 第一章 绪论
  • 1.1 SNP介绍
  • 1.1.1 SNP的概念与特点
  • 1.1.2 SNP的研究意义
  • 1.1.3 SNP的数学模型
  • 1.1.4 SNP的研究阶段
  • 1.2 本文的研究内容及创新点
  • 1.3 本文的结构安排
  • 第二章 熵与最大熵
  • 2.1 熵的简介
  • 2.2 最大熵简介
  • 2.3 本章小结
  • 第三章 建模算法
  • 3.1 问题的提出
  • 3.2 算法结构
  • 3.3 本文所用的概念
  • 3.3.1 数据形式
  • 3.3.2 bootstrap算法
  • 3.3.3 稳定性排序
  • 3.3.4 解交叉
  • 3.3.5 准确性判断
  • 3.4 本章小结
  • 第四章 实验过程及结果
  • 4.1 实验样本集合的扩展
  • 4.1.1 bootstrap建模
  • 4.1.2 bootstrap算法实验
  • 4.2 稳定性计算
  • 4.2.1 稳定性算法及实现
  • 4.2.2 稳定性算法的实验
  • 4.3 最大熵优化
  • 4.3.1 最大熵建模
  • 4.3.2 最大熵实验
  • 4.4 解交叉过程
  • 4.4.1 解交叉算法及实现
  • 4.4.2 解交叉算法的实验
  • 4.5 准确性判断
  • 4.6 实验环境与代码说明
  • 4.7 实验总结
  • 4.8 本章小结
  • 第五章 总结与展望
  • 相关论文文献

    • [1].产蛋和停产武定鸡卵巢转录组SNP分析[J]. 中国家禽 2020(03)
    • [2].基于SNP芯片的浦东鸡保种分析[J]. 中国家禽 2020(06)
    • [3].不同周龄南丹瑶鸡蛋壳颜色相关SNP的筛选[J]. 中国家禽 2020(07)
    • [4].乳腺癌相关SNP分子标记专利技术综述[J]. 江西化工 2020(04)
    • [5].基于SNP标记的爆裂玉米农家品种遗传多样性[J]. 作物杂志 2020(05)
    • [6].利用猪1.4M高密度SNP芯片检测巴马香猪全基因组拷贝数变异[J]. 畜牧兽医学报 2020(09)
    • [7].藏猪甲基转移酶3a基因的SNP筛选及其在精子中的表达分析[J]. 河南农业科学 2020(10)
    • [8].基于益生菌调节的太平鸡回肠SNP位点分析[J]. 安徽农业科学 2020(21)
    • [9].基于SNP标记的广东省松材线虫种群分化研究[J]. 南京林业大学学报(自然科学版) 2019(06)
    • [10].2株温和气单胞菌SNP位点比较分析[J]. 中国兽医学报 2017(03)
    • [11].VEGF的SNP状态预测贝伐株单抗治疗转移性结直肠癌的长期疗效[J]. 实用癌症杂志 2017(04)
    • [12].低温层积和SNP处理对白颖薹草种子萌发的影响[J]. 种子 2017(05)
    • [13].基于SNP位点鉴定藏菖蒲及其近缘种[J]. 中国现代中药 2014(11)
    • [14].基于SNP标记的玉米自交系遗传多样性分析[J]. 玉米科学 2015(02)
    • [15].基于SNP框架的“抗生素”主题活动构建与思考[J]. 中国校外教育 2019(S1)
    • [16].基于SNP标记揭示我国小麦品种(系)的遗传多样性[J]. 作物学报 2020(02)
    • [17].基于高密度SNP标记的苹果属15种植物资源的亲缘关系与遗传结构分析[J]. 中国农业科学 2020(16)
    • [18].半滑舌鳎(Cynoglossus semilaevis)Nramp基因克隆与表达分析及SNP筛选[J]. 渔业科学进展 2016(04)
    • [19].虾夷马粪海胆溶菌酶基因SNP标记的开发及多态性分析[J]. 中国农业科技导报 2012(05)
    • [20].SNP浸种对NaCl胁迫下桑树种子萌发的影响[J]. 山东农业科学 2020(03)
    • [21].基于50K SNP芯片技术对金华猪和嵊县花猪繁殖性状的全基因组关联分析[J]. 中国畜牧杂志 2020(07)
    • [22].基于SNP标记的糯玉米种质资源遗传多样性分析[J]. 玉米科学 2020(03)
    • [23].三疣梭子蟹生长相关SNP位点的鉴定[J]. 中国水产科学 2015(03)
    • [24].大小鼠微卫星和SNP遗传检测的研究进展[J]. 实验动物科学 2014(03)
    • [25].外源SNP对低温下马铃薯试管苗相关酶活性的影响[J]. 甘肃农业科技 2013(06)
    • [26].利用核心SNP位点鉴别玉米自交系的研究[J]. 玉米科学 2013(04)
    • [27].SNP对油菜种子萌发和幼苗生长的影响[J]. 热带农业工程 2011(05)
    • [28].欧洲黑杨基因资源材性关联基因的SNP分析[J]. 遗传 2008(06)
    • [29].基于地黄转录组数据的SNP标记开发与地黄指纹图谱构建[J]. 生物技术通报 2019(11)
    • [30].马氏珠母贝SNP标记开发及家系遗传多态性分析[J]. 海洋通报 2016(01)

    标签:;  ;  ;  

    最大熵算法在SNP与疾病关联性研究的应用
    下载Doc文档

    猜你喜欢