基于互信息频度的特征选择及其在SNP关联分析中的应用

基于互信息频度的特征选择及其在SNP关联分析中的应用

论文摘要

SNP (Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究的重要领域之一。然而,由于SNP大量存在于人类基因组中,并且存在大量多余的及与疾病不相关的SNP,使得寻找与疾病相关的SNP成为一个难点。通常解决这类问题的办法是进行特征选择。特征选择自从上世纪70年代以来得到了长足的发展,有许多特征选择的方法可用于一般性问题。本文应用特征选择来试图找出与疾病相关的SNP。论文利用互信息作为特征选择的评价函数,提出了一种基于互信息频度的启发式搜索候选特征集的方法(枝条矩阵搜索算法),对SNP进行特征选择实验,并对算法及实验结果进行详细的分析。之后做了两组对比实验,第一组实验对ME算法和mRMR算法进行了仿真,并比较了这两种算法和本文算法的性能;第二组实验针对model内SNP之间的影响以及rnodel间SNP的影响。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 课题背景
  • 1.1.1 SNP介绍
  • 1.1.2 SNP研究价值
  • 1.1.3 SNP的特点
  • 1.1.4 SNP研究的三个阶段
  • 1.2 国内外研究现状
  • 1.3 本文研究内容及结构
  • 第二章 特征选择
  • 2.1 特征选择概念
  • 2.2 特征子集选择算法和评价函数
  • 2.3 特征选择算法分类及经典算法
  • 2.4 本章小结
  • 第三章 基于互信息频度的特征选择算法
  • 3.1 基于互信息和频度的特征选择算法的框架
  • 3.2 信息论与互信息
  • 3.2.1 信息论基本内容及发展
  • 3.2.2 互信息
  • 3.3 枝条矩阵搜索算法
  • 3.3.1 枝条矩阵搜索算法描述
  • 3.3.2 时间复杂度分析
  • 3.3.3 参数分析
  • 3.4 性能评价
  • 3.4.1 ROC曲线简述
  • 3.4.2 ROC在本文性能评价中的应用分析
  • 3.5 本章小结
  • 第四章 实验与结果分析
  • 4.1 实验数据处理与实验结果
  • 4.1.1 实验数据处理
  • 4.1.2 实验环境
  • 4.1.3 实验结果
  • 4.2 实验一:不同方法的比较
  • 4.2.1 ME方法及mRMR算法简介
  • 4.2.2 对比实验的实验结果
  • 4.2.3 ROC曲线性能对比
  • 4.3 实验二:SNP关联影响分析
  • 4.3.1 model内部SNP之间的影响
  • 4.3.2 model之间SNP的影响
  • 4.4 本章小结
  • 总结与展望
  • 致谢
  • 参考文献
  • 硕士期间发表的论文
  • 相关论文文献

    • [1].产蛋和停产武定鸡卵巢转录组SNP分析[J]. 中国家禽 2020(03)
    • [2].基于SNP芯片的浦东鸡保种分析[J]. 中国家禽 2020(06)
    • [3].不同周龄南丹瑶鸡蛋壳颜色相关SNP的筛选[J]. 中国家禽 2020(07)
    • [4].乳腺癌相关SNP分子标记专利技术综述[J]. 江西化工 2020(04)
    • [5].基于SNP标记的爆裂玉米农家品种遗传多样性[J]. 作物杂志 2020(05)
    • [6].利用猪1.4M高密度SNP芯片检测巴马香猪全基因组拷贝数变异[J]. 畜牧兽医学报 2020(09)
    • [7].藏猪甲基转移酶3a基因的SNP筛选及其在精子中的表达分析[J]. 河南农业科学 2020(10)
    • [8].基于益生菌调节的太平鸡回肠SNP位点分析[J]. 安徽农业科学 2020(21)
    • [9].基于SNP标记的广东省松材线虫种群分化研究[J]. 南京林业大学学报(自然科学版) 2019(06)
    • [10].2株温和气单胞菌SNP位点比较分析[J]. 中国兽医学报 2017(03)
    • [11].VEGF的SNP状态预测贝伐株单抗治疗转移性结直肠癌的长期疗效[J]. 实用癌症杂志 2017(04)
    • [12].低温层积和SNP处理对白颖薹草种子萌发的影响[J]. 种子 2017(05)
    • [13].基于SNP位点鉴定藏菖蒲及其近缘种[J]. 中国现代中药 2014(11)
    • [14].基于SNP标记的玉米自交系遗传多样性分析[J]. 玉米科学 2015(02)
    • [15].基于SNP框架的“抗生素”主题活动构建与思考[J]. 中国校外教育 2019(S1)
    • [16].基于SNP标记揭示我国小麦品种(系)的遗传多样性[J]. 作物学报 2020(02)
    • [17].基于高密度SNP标记的苹果属15种植物资源的亲缘关系与遗传结构分析[J]. 中国农业科学 2020(16)
    • [18].半滑舌鳎(Cynoglossus semilaevis)Nramp基因克隆与表达分析及SNP筛选[J]. 渔业科学进展 2016(04)
    • [19].虾夷马粪海胆溶菌酶基因SNP标记的开发及多态性分析[J]. 中国农业科技导报 2012(05)
    • [20].SNP浸种对NaCl胁迫下桑树种子萌发的影响[J]. 山东农业科学 2020(03)
    • [21].基于50K SNP芯片技术对金华猪和嵊县花猪繁殖性状的全基因组关联分析[J]. 中国畜牧杂志 2020(07)
    • [22].基于SNP标记的糯玉米种质资源遗传多样性分析[J]. 玉米科学 2020(03)
    • [23].三疣梭子蟹生长相关SNP位点的鉴定[J]. 中国水产科学 2015(03)
    • [24].大小鼠微卫星和SNP遗传检测的研究进展[J]. 实验动物科学 2014(03)
    • [25].外源SNP对低温下马铃薯试管苗相关酶活性的影响[J]. 甘肃农业科技 2013(06)
    • [26].利用核心SNP位点鉴别玉米自交系的研究[J]. 玉米科学 2013(04)
    • [27].SNP对油菜种子萌发和幼苗生长的影响[J]. 热带农业工程 2011(05)
    • [28].欧洲黑杨基因资源材性关联基因的SNP分析[J]. 遗传 2008(06)
    • [29].基于地黄转录组数据的SNP标记开发与地黄指纹图谱构建[J]. 生物技术通报 2019(11)
    • [30].马氏珠母贝SNP标记开发及家系遗传多态性分析[J]. 海洋通报 2016(01)

    标签:;  ;  ;  

    基于互信息频度的特征选择及其在SNP关联分析中的应用
    下载Doc文档

    猜你喜欢