基因型常有误差时单倍型分析的统计方法

基因型常有误差时单倍型分析的统计方法

论文摘要

单倍型在现代遗传流行病学研究中起着非常关键的作用,尤其是在进行复杂疾病基因定位研究时,基于单倍型的连锁分析或关联分析方法比基于单个SNP位点的分析方法有更大的功效。但实际中我们直接得到的不是个体的单倍型而是基因型,因此单倍型分析的首要任务就是根据已知的基因型数据推断个体的单倍型,其次是利用得到的单倍型进行连锁分析和关联分析的研究。然而目前已有的单倍型分析的统计方法(包括单倍型推断方法和基于单倍型的连锁分析与关联分析方法)几乎都没有考虑基因型测量误差给单倍型分析带来的影响,它们均是在基因型不含有测量误差的假设下进行的,问题是目前所用的大部分基因型数据都含有一定的误差。本文的主要目的就是给出基因型带有测量误差时单倍型分析的统计方法,其中主要包括单倍型推断方法和单倍型关联分析的方法。 本文分别就群体数据结构和家系数据结构给出了基因型含有测量误差时的单倍型推断方法,并且给出了降低基因型误差影响的单倍型关联分析的方法。首先在群体结构的单倍型推断研究中,我们提出了两种全新的设计方法:双重抽样设计和多次测量设计,并基于这两种设计方法提出了适合于含有误差基因型的单倍型推断的DS-EM算法和MG-EM算法。对于家系数据结构,我们充分利用家系中个体之间有用的相关信息提出了基因型含有误差时单倍型推断的GS-PEM算法。在进行单倍型关联分析的研究时,我们就病例-对照研究中基因型含有误差情况下考虑了基于单倍型的logistic回归模型,给出了单倍型关联分析研究的似然方法。上述各种方法我们都通过模拟研究或实例分析考察其在实际中的可行性,并且通过和其他方法的模拟比较研究去分析其优劣性。无论是理论分析还是模拟研究都说明我们的方法在实际中是可行的,并且能够大大降低基因型测量误差给单倍型分析带来的影响。

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 绪论
  • §1.1 概述
  • §1.2 遗传学发展简史与遗传流行病学
  • §1.3 单倍型分析的重要性与研究现状
  • §1.3.1 单倍型分析的重要性
  • §1.3.2 单倍型推断的研究现状
  • §1.3.3 单倍型关联分析的研究现状
  • §1.4 基因型测量误差
  • §1.5 本文的主要工作和结构安排
  • 第二章 遗传学基本概念与统计定义
  • §2.1 概述
  • §2.2 遗传学基本术语与部分统计学描述
  • §2.3 说明与小结
  • 第三章 带有测量误差群体数据的单倍型推断方法
  • §3.1 引言
  • §3.2 双重抽样与多次测量的基因型分类方法
  • §3.2.1 双重抽样设计与“基因图谱”
  • §3.2.2 多次测量设计与“基因图谱”
  • §3.3 单倍型推断的DS-EM算法和MG-EM算法
  • §3.3.1 DS-EM算法
  • §3.3.2 MG-EM算法
  • §3.4 相对样本大小的计算
  • §3.4.1 DS-EM的观测信息阵
  • §3.4.2 MG-EM的观测信息阵
  • §3.5 模拟研究
  • §3.5.1 模拟设计
  • §3.5.2 DS-EM、MG-EM与传统EM方法的比较研究
  • §3.5.3 基于真实数据的模拟研究
  • §3.6 例子
  • §3.7 讨论
  • 第四章 带有测量误差家系数据的单倍型推断方法
  • §4.1 引言
  • §4.2 记号与“基因图谱”
  • §4.3 基于家系结构估计单倍型频率的GS-PEM方法
  • §4.4 参数估计的标准差
  • §4.5 模拟与模拟结果
  • §4.5.1 模拟设计
  • §4.5.2 模拟结果
  • §4.6 讨论
  • 第五章 病例-对照研究中基因型带有测量误差时单倍型关联分析的似然方法
  • §5.1 引言
  • §5.2 记号和“基因图谱”
  • §5.3 统计模型
  • §5.4 基因型不确定时估计模型参数的加权EM方法
  • §5.5 参数估计的标准差
  • §5.6 检验统计量
  • §5.7 模拟与结果
  • §5.7.1 模拟设计
  • §5.7.2 模拟结果
  • §5.8 讨论
  • 结论
  • 附录
  • 参考文献
  • 在学期间公开发表(投稿)论文情况
  • 致谢
  • 相关论文文献

    • [1].淹水胁迫对不同基因型东方杉幼苗生理生化的影响[J]. 种子 2020(01)
    • [2].基因型填充策略研究[J]. 畜牧兽医学报 2020(09)
    • [3].重庆地区HBV基因型与临床特征相关性分析[J]. 国际检验医学杂志 2018(20)
    • [4].小麦氮高效基因型的蛭石盒筛选[J]. 中国农业科技导报 2015(04)
    • [5].长沙市2014—2019年31株风疹病毒基因型流行特征[J]. 中国热带医学 2020(06)
    • [6].不同钾基因型烟草钾吸收和生理生化特性研究[J]. 中国烟草科学 2017(05)
    • [7].乙型肝炎病毒B、C基因型全基因组序列的克隆[J]. 国际检验医学杂志 2016(22)
    • [8].氮高效利用基因型大麦氮素转移及氮形态组分特征[J]. 中国农业科学 2015(06)
    • [9].钾胁迫对不同耐低磷基因型玉米生长和磷吸收的影响[J]. 湖北农业科学 2015(02)
    • [10].中国部分地区结核分枝杆菌北京基因型菌株分布初步分析[J]. 实用预防医学 2012(05)
    • [11].基因型对黄瓜辐射花粉诱导单倍体的影响[J]. 中国农学通报 2011(19)
    • [12].桥本甲状腺炎患者杀伤细胞免疫球蛋白样受体基因型分析[J]. 山东大学学报(医学版) 2009(08)
    • [13].低反应性乙型肝炎表面抗原患者血清核酸定量及基因型的相关性分析[J]. 中国卫生检验杂志 2019(06)
    • [14].4种解释系统对HIV-1基因型耐药解释相关性评价[J]. 沈阳医学院学报 2016(04)
    • [15].腺病毒7d基因型与7b基因型全基因组比较分析[J]. 病毒学报 2017(02)
    • [16].羊草基因型多样性能增强种群对干扰的响应[J]. 生态学报 2015(23)
    • [17].氮高效利用基因型水稻干物质生产和氮素积累特性[J]. 草业学报 2014(06)
    • [18].云南省部分地区结核分枝杆菌北京基因型流行情况分析[J]. 中国病原生物学杂志 2015(09)
    • [19].遗传题中如何确定亲本的基因型[J]. 新课程学习(学术教育) 2009(04)
    • [20].2013-2015年江苏省腮腺炎病毒基因特征和G基因型病毒株全基因序列分析[J]. 中国疫苗和免疫 2020(05)
    • [21].乙型肝炎病毒新基因型I与肝脏疾病关系的研究[J]. 广西医学 2014(01)
    • [22].氮高效利用基因型水稻生育后期氮素分配与转运特性[J]. 应用生态学报 2014(04)
    • [23].北京基因型结核杆菌播散致病的相关性研究[J]. 国际检验医学杂志 2012(01)
    • [24].不同基因型紫苏耐盐性比较研究[J]. 西北植物学报 2011(02)
    • [25].烟台地区HBV基因型分析与临床特点[J]. 肝脏 2010(01)
    • [26].血管紧张素转换酶基因型多态性与妊娠期肝内胆汁淤积症相关性[J]. 中国妇幼保健 2010(22)
    • [27].基因型与不同激素配比对马铃薯茎尖组织培养的影响[J]. 中国马铃薯 2009(01)
    • [28].不同基因型水稻耐汞性及汞积累差异比较[J]. 安徽农业科学 2009(02)
    • [29].中国流行的麻疹病毒基因型和亚型趋势分析[J]. 中国疫苗和免疫 2009(02)
    • [30].磷水平对不同耐低磷玉米基因型幼苗生长和养分吸收的影响[J]. 应用与环境生物学报 2008(03)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    基因型常有误差时单倍型分析的统计方法
    下载Doc文档

    猜你喜欢