关于定位人类复杂性状基因位点的连锁不平衡指数研究

关于定位人类复杂性状基因位点的连锁不平衡指数研究

论文摘要

背景:定位与各种性状和疾病相关的基因是人类遗传研究中最重要的任务之一。对于受遗传和环境因素共同决定的复杂疾病和数量性状,采用传统的连锁分析和数量性状位点(quantitative trait locus,QTL)定位可以确定包含一个性状位点的约10厘摩(cM)的基因组区域。但这对基因的物理作图远远不够,除非进一步精细定位将这个较大的基因组区域缩小到更小。随着遗传领域中快速增长的单核苷酸多态性(singlenucleotide polymorphism,SNP)和详细的人类单体型数据的获得,群体水平上的连锁不平衡(linkage disequilibrium,LD)定位或关联研究被广泛用来精细定位人类复杂性状位点。一个简单的不平衡定位方法的关键是选取一个好的不平衡指数,因为一个优良的不平衡指数能有效的度量性状基因与它紧密相连的遗传标记之间的连锁不平衡程度,它的大小直接反应了遗传标记与性状基因的距离。常用连锁不平衡指数是基于比较受累个体和非受累个体(或选择样本)之间的标记基因或单体型频率的病例-对照分析。但这种方法并不是一致最有效的。而增大样本中标记基因或单体型频率的差有可能提高基因定位的统计功效。申农(Shannon)熵,一个频率的非线性函数,可以增大基因频率的差。已有研究潜在假定遗传数据不存在基因型错误,但在实际的研究中可能存在遗传数据的错误,而遗传数据的错误可能对连锁不平衡指数产生严重的影响。目的:基于熵理论,提出两个新的利用高度稠密的分子标记精细定位人类复杂性状位点的不平衡指数l和lx;同时研究基因型错误对指数lx和l的影响。方法:从理论分析和计算机模拟的角度考察两个指数的性质,将它们与常用的LD指数进行比较;在一个随机的误差模型假定下从理论分析的角度研究基因型错误对指数lx和l影响。结果:指数l用来精细定位复杂疾病位点,使用病例-对照样本和稠密标记,比较了标记熵与标记条件熵之间的差异。指数lx使用极端群体样本和高稠密标记图谱精细定位数量性状位点,比较了由高极端群体样本和低极端群体样本构成的混合群体中的标记熵与标记条件熵之间的差异。当存在基因型错误时,两个指数由于依赖于基因型错误率因而值变小了。结论:指数l和lx能直接反映标记基因和性状基因之间的连锁不平衡程度。在原始代性状相关基因首次出现于被研究群体时性状相关基因与标记基因之间完全关联,性状基因与标记基因没有发生新的突变,和被研究群体很大的三个假定下,指数l和lx是遗传图距的递减函数,而且不依赖于标记基因频率。通过与常用连锁不平衡指数pexcess的比较分析,发现分别用l和lx定位复杂疾病位点和数量性状位点的灵敏度比用pexcess时的灵敏度高。同时,我们也调查了初始不完全关联和基因突变对两个指数的影响,发现l和lx受初始不完全关联和基因突变的影响比较小,在突变率比较低时,l和lx仍然适用于精细定位。在各种参数选择下通过计算机模拟考察l和lx的性质,发现两个指数都能以较高(80%)的功效定位性状位点。lx和l由于依赖于基因型错误率因而值变小,改变率随着标记基因频率的增大而增大;当基因型错误率较低(0.01)而标记基因频率不是特别大(<0.9)时,lx和l的改变率在10%以下;当基因型错误率较高(0.03,0.05),改变率超过10%,在性状相关基因的频率很小(如0.10)而标记基因频率特别大(0.9)时,改变率达到50%甚至以上。基因型错误的影响也通过基于血管紧张肽转化酶(ACE)基因的10个SNPs单体型频率的模拟研究得到了证实。在遗传分析中建议避免或尽可能地降低误差的出现。

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 前言
  • 1.1 人类复杂性状的特性
  • 1.2 定位人类复杂性状基因的方法和策略
  • 1.2.1 人类复杂性状基因定位的统计方法
  • 1.2.2 定位人类复杂性状基因的策略
  • 1.3 本文的研究目的
  • 第二章 精细定位复杂性状位点的连锁不平衡指数
  • 2.1 精细定位疾病基因的连锁不平衡指数l
  • 2.1.1 方法
  • 2.1.2 模拟
  • 2.1.3 指数l的性质
  • 2.2 精细定位数量性状位点(QTL)的连锁不平衡指数lx
  • 2.2.1 精细定位数量性状位点(QTL)的指数lx
  • 2.2.2 初始不完全关联和基因突变
  • 2.3 讨论
  • 第三章 基因型错误对连锁不平衡指数的影响
  • 3.1 方法
  • 3.1.1 误差模型
  • 3.1.2 基因型错误存在时的连锁不平衡指数
  • 3.2 结果
  • 3.2.1 基因型错误对指数lx的影响
  • 3.2.2 基因型错误对指数l的影响
  • 3.3 一个基于ACE基因的模拟应用
  • 3.4 讨论
  • 第四章 结论
  • 参考文献
  • 附录
  • 综述
  • 致谢
  • 攻读博士期间发表的论文及参加的科研项目
  • 相关论文文献

    • [1].精神分裂症及糖尿病视网膜病变的连锁不平衡分析[J]. 糖尿病新世界 2015(03)
    • [2].鸡脂肪性状重要候选基因的连锁不平衡模式分析[J]. 农业生物技术学报 2011(02)
    • [3].CYP3A4 rs4646440与rs2242480及CYP3A5 rs776746连锁不平衡分析及其对肝组织CYP3A4表达及活性的影响[J]. 郑州大学学报(医学版) 2019(02)
    • [4].北方汉族MICA基因遗传多态性及与HLA-B连锁不平衡研究[J]. 中国输血杂志 2019(05)
    • [5].水稻中连锁不平衡的研究进展[J]. 科技经济市场 2011(06)
    • [6].SNP连锁不平衡下的基因隐私保护模型[J]. 软件学报 2019(04)
    • [7].猪CD4基因多态性及生物信息学分析[J]. 基因组学与应用生物学 2018(11)
    • [8].通过熵理论使用核心家系进行精细定位(英文)[J]. 生物数学学报 2014(01)
    • [9].关联分析及其在果树育种研究中的应用[J]. 分子植物育种 2018(07)
    • [10].自杀未遂与5-羟色胺转运体基因的连锁不平衡研究[J]. 重庆医学 2011(17)
    • [11].大连地区汉族人群HLA-A,-B,-DRB1位点基因多态性研究[J]. 中国免疫学杂志 2018(06)
    • [12].一个基于熵的指数精细定位人类复杂性状位点(英文)[J]. 生物数学学报 2011(02)
    • [13].GATA6基因启动区多态性与急性心肌梗死患者易感性和临床特征的相关性分析[J]. 中国动脉硬化杂志 2019(06)
    • [14].毛白杨干细胞决定基因Wuschel的克隆及其单核苷酸多态性分析[J]. 林业科学 2009(01)
    • [15].IRF6、ENPP1基因在新疆维吾尔族、汉族人群中单核苷酸多态性位点的分布特征[J]. 临床口腔医学杂志 2018(06)
    • [16].脑梗死与纤维蛋白原基因单倍型的相关性分析[J]. 中国医药导报 2017(14)
    • [17].同源四倍体自然群体的连锁不平衡分析模型[J]. 南京林业大学学报(自然科学版) 2014(04)
    • [18].单倍型分析及其在全基因组关联分析中的研究进展[J]. 猪业科学 2017(08)
    • [19].基于AFLP分析的山核桃群体结构及遗传多样性[J]. 福建林业科技 2009(04)
    • [20].334份青藏高原野生大麦群体结构及连锁不平衡水平分析[J]. 西北农业学报 2017(02)
    • [21].关联分析在玉米遗传学研究中的应用[J]. 玉米科学 2008(01)
    • [22].不同人群的SNPs基因型数据中r~2值对TagSNP数量的影响[J]. 中国卫生统计 2012(03)
    • [23].毛白杨纤维素合酶基因PtCesA_4的克隆、表达及单核苷酸多态性分析[J]. 林业科学 2009(05)
    • [24].梅州地区TLR4基因连锁不平衡与缺血性脑卒中相关性研究[J]. 现代预防医学 2020(08)
    • [25].人类白细胞抗原基因与Graves病相关性的研究进展[J]. 医学综述 2019(12)
    • [26].基于熵理论的病例父母亲对照研究来精细定位(英文)[J]. 数学理论与应用 2012(04)
    • [27].eNOS基因标签单核苷酸多态性与新疆汉族原发性高血压的相关性研究[J]. 中国病理生理杂志 2011(11)
    • [28].HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5与HLA-DQ位点不关联病例的研究[J]. 军医进修学院学报 2008(01)
    • [29].引进陆地棉种质材料的遗传多样性、群体结构与连锁不平衡[J]. 分子植物育种 2015(06)
    • [30].脑源性神经营养因子基因单核苷酸多态性与陕西汉族海洛因依赖群体的相关性研究[J]. 西安交通大学学报(医学版) 2015(06)

    标签:;  ;  ;  ;  ;  ;  

    关于定位人类复杂性状基因位点的连锁不平衡指数研究
    下载Doc文档

    猜你喜欢