中国南方人群β-地中海贫血CD41-42(-CTTT)突变的起源与扩散的群体遗传学研究

中国南方人群β-地中海贫血CD41-42(-CTTT)突变的起源与扩散的群体遗传学研究

论文摘要

背景与目的β-地中海贫血(β-thalassemia,简称β-地海)是全球最常见、对人类健康危害最大的单基因遗传病之一,其分子遗传学基础是由于β-珠蛋白基因缺陷,导致血红蛋白分子中β-珠蛋白肽链的合成减少或缺如,从而引起血红蛋白的α/β珠蛋白肽链比例失衡,进而导致血红蛋白不稳定、红细胞破坏而产生以溶血性贫血为主的症状群,在临床上表现为轻重不等的慢性进行性溶血性贫血。β-地贫是我国长江以南各省区人群中发生率最高、危害最为严重的遗传病之一,其中尤以广西、广东、海南等地发生率为甚,广西和广东人群携带率分别为4.8%~6.78%和2.54%~3.36%,海南人群的携带率估计约为2.7%,而海南黎族人群高达8%~11.6%。流行病学、遗传学和体外实验研究结果表明,人类β珠蛋白基因是受疟疾选择作用最明显的基因之一。流行病学研究结果显示,β珠蛋白基因常见的变异HbS(β6Glu→Val)、HbC(βGlu→Lys)和HbE(β26Glu→Lys)以及β-地贫主要分布在非洲、地中海地区、中东、东南亚和中国南方等热带、亚热带地区,与疟疾的流行区域基本一致。细胞学和流行病学研究发现,血红蛋白病HbS、HbC、HbE以及β-地贫的个体和红细胞均具有抵抗疟原虫感染和降低恶性疟严重程度的作用。最近对β-珠蛋白基因簇单核苷酸多态性的连锁不平衡及单体型的分析发现,HbS、HbC和HbE的发生可能是人类进化史上近5000年内独立发生的事件,提示人类β珠蛋白基因变异与疟疾选择作用密切相关。由于疟疾流行区人群中杂合子优势具有保护人类免患疟疾或减缓恶性疟严重程度的作用。因此,这些具有选择优势的基因在疟疾发生地人群中的高频率有利于人类抵抗疟疾感染而得以生存和繁衍。β-地贫的基因突变具有高度的异质性,不同种族人群拥有自己一组独特的β-地贫基因突变谱,表现为明显的地域性或群体特异性。到目前为止,在我国南方人群中至少已发现36种β地贫突变类型。其中,常见的突变基因主要有8种,包括CD41-42(-CTTT)、IVS-2-654C→T、CD71-72(+A)、CD17A→T、-28A→G,CD26 G→A(HbE)、-29 A→G和CD43G→T突变,分布在我国东南和西南等南方地区的人群中。值得注意的是,我国人群的β-地贫基因突变类型中,CD41-42(-CTTT)缺失是一种最常见和分布最广泛的突变,在我国南方各省人群中,该突变约占地贫突变的40%,而黎族人中β地贫基因突变几乎全为CD41-42(-CTTT)突变。我们最近的研究说明基因转换(gene conversion)可能是人群中CD41-42(-CTTT)突变扩散的主要分子机制。对于特定人群来说,常见和广泛分布的突变往往与其历史和种群变迁相关,因此,可以通过遗传病突变来追朔其建立者或祖先,进而阐述人群起源和进化史,这也是目前国际上分子进化研究的前沿课题。壮族是我国人口最多的少数民族,主要聚居在广西壮族自治区的南部和中西部地区,源于古代百越的一支—骆越和瓯越,是我国历史上民族的主体很少迁徙的民族之一。黎族被认为是海南的土著民族,其先民也源于骆越,在海南岛至少有3000年以上的历史,与我国南方属汉藏语系的操壮侗语族诸语言的壮族、侗族、水族、傣族、布依族等民族有密切的渊源关系。尽管β珠蛋白基因CD41-42(-CTTT)突变是包括壮族和黎族人群在内的我国南方地区人群中最常见的β-地贫突变,但是,该突变何时出现?在黎族人群迁徙至海南前出现还是迁徙至海南后出现?在起源上,黎族、壮族和汉族人群的CD41-42(-CTTT)之间有何关系?是否与疟疾选择作用存在相关性?黎族人群为什么有如此高的携带率?到目前为止尚未有确切的分子遗传学依据。本研究根据壮族和黎族密切的历史渊源关系以及黎族在海南有史可证的时代背景,选择在广西和海南当地人群中CD41-42(-CTTT)这一最常见的β-地贫突变为对象,通过群体遗传学分析来阐述中国南方人群中这一具有选择优势的致病突变的起源与扩散,并企图解释人群自然选择的分子进化机制。材料与方法1.实验设计和样品:在海南岛采集2291例黎族人随机样品,在广西地区采集1627例壮族人随机样品,用于当地人群的β-地贫基因频率调查。以随机数方式分别从上述海南2291例黎族人和广西1627例壮族人中选出201例黎族人和354例壮族人样品,并分别采集海南岛黎族人居住地的200例汉族人随机样品和广西地区壮族人居住地的262例汉族人样品,用于中国南方人群β-地贫CD41-42(-CTTT)突变的分子进化研究。血液学参数和血红蛋白A2定量用于筛查样品中的β-地贫携带者,DNA诊断技术用于进行β-地贫携带者突变的分子诊断。经突变分析确诊,并在上述二地的四组样品中排除了其他类型的β-地贫突变样品后,核准用于群体遗传学分析的样品合计907例,分别为:海南黎族人201例,海南汉族人200例,广西壮族人280例和广西汉族人226例。此外,我们还采集了8例β-地贫CD41-42(CTTT)纯合子患者样品用于本研究,分别为海南黎族人1例,海南汉族人3例、广西汉族人2例和广东汉族人2例。2.方法:用盐析法或磁珠法提取外周血白细胞DNA。用全血细胞计数(FBC)和HbA2含量测定筛查β-地贫携带者;用等位基因特异PCR和反向点杂交诊断41-42(-CTTT)突变。用PCR扩增β-珠蛋白全长基因及其周围序列(3.5 kb片段),用双向核苷酸序列测定分析β-珠蛋白基因的单核苷酸多态性(SNPs)。用基因记数方法计算出各个位点的基因型频率和等位基因频率,用x2检验进行基因型Hardy-Weinberg平衡吻合度和各人群的SNP等位基因频率比较,用Fisher’s确切概率法检测各个人群之间的各种CD41-42(-CTTT)单倍型的频率有无统计学差异。计算各个人群的单核苷酸多态性杂合度,用方差分析比较各个人群单核苷酸多态性杂合度的差异,并计算人群的分化指数,分析各个人群之间β-珠蛋白基因遗传结构的分化情况。用Phase2.1.1软件进行单倍型分析,用x2检验进行各个人群单倍型频率的比较。用DnaSP4.10进行Four Gamete分析,进行β-珠蛋白基因中重组事件以及发生位置的评估。用Alequin3.01软件计算各个位点之间的两两相对连锁不平衡系数D’值、两两相对连锁不平衡相关系数r2值、各个人群β-珠蛋白基因的核苷酸分离位点数θ值和任意两序列之间核苷酸差异的平均数π值,并计算Tajima’s D值进行分析对象的中性检验,评估SNP之间的两两不平衡关系及与选择作用的关系。用Net-Work4.1.1.2软件构建样品的单倍型系统树,观察各种单倍型之间的演变关系。参考相关史料来解释和讨论基因突变及其人群起源和进化历史。结果与讨论在海南岛黎族人群随机大样品调查得出的β-地贫CD41-42(-CTTT)突变携带率为8.16%,未发现其它突变,随机抽取的201例黎族人CD41-42(-CTTT)突变的携带率为10.45%,抽样样本和人群的CD41-42(-CTTT)突变携带率结果之间没有统计学差异(P>0.05)。根据血液学参数和HbA2含量,在1624份广西壮族随机大样品中调查得出β-地贫突变携带率为6.64%。在随机抽取的354份壮族样品和262例汉族样品中,CD41-42(-CTTT)突变携带率的结果分别为3.39%和3.05%,在剔除其它β-地贫突变后,最终入选的280例壮族样品和226例汉族样品中CD41-42(-CTTT)突变携带率的结果分别为3.92%和3.54%,两组壮族样本或两组汉族样本之间CD41-42(-CTTT)突变携带率没有统计学差异(P>0.05)。200例海南汉族人检出CD41-42(-CTTT)突变携带者2例,未发现其它β-地贫突变,其CD41-42(-CTTT)突变携带率为1.00%。在上述二地的四组人群样品的β-珠蛋白基因中,除了CD41-42(-CTTT)缺失突变外,还存在13个SNP位点,四组人群中的14个多态性位点的基因型均达到Hardy-Weinberg平衡;四组人群中,除了CD41-42(-CTTT)突变的等位基因存在统计学差异外(P<0.05),其它位点的等位基因频率没有统计学差异。本研究使用这些多态性位点进行单倍型分析。Four Gamete分析结果显示,四个人群β-珠蛋白基因中,除了少数位点外,大部分位点均有重组事件发生。单倍型分析显示,四组人群中共发现47种单倍型,其中,海南黎族和广西壮族人群分别存在26种和20种单倍型,海南汉族人群和广西汉族人群中分别存在20种和27种单倍型,频率较高的单倍型为HP3、HP11、HP30和HP43,这四种单倍型所占的比例为89.14%。统计学分析表明,频率较高的单倍型HP3、HP11、HP30和HP43在四组人群中的分布没有显著性差异,而CD41-42(-CTTT)突变出现的主要单倍型HP20和HP47在四组人群中的分布存在显著性差异(P<0.05),他们分别由HP3和HP43发生一次突变衍生而成。在CD41-42(-CTTT)突变的单倍型中,黎族人群中带有CD41-42(-CTTT)突变的单倍型HP20的频率(95.6%)明显高于其他三组人群的单倍型HP20频率(广西壮族27.2%,广西汉族33.3%,海南汉族62.5%)(P<0.05)。由于黎族人群与壮族人群均起源于骆越,他们的分化时间约在3000~5000年以前,根据黎族人群CD41-42(-CTTT)突变单倍型遗传结构单一的特点,我们推测我国人群中的CD41-42(-CTTT)突变为单一起源,该突变发生在黎族和壮族人群分化之前,至少已有3000年的历史,HP20可能是最早出现的CD41-42(-CTTT)突变单倍型,然后在进化过程中通过基因转换的方式产生HP47。连锁不平衡分析显示,14个SNP位点中,除了CD41-42(-CTTT)突变及个别位点与其它位点的连锁程度比较弱外,其它位点之间呈较强连锁不平衡。结合Four Gamete分析的结果,我们在大样本研究中进一步证实了我们新近发现的结果,即基因转换是进化过程中β-珠蛋白基因变异的形成以及CD41-42(-CTTT)在人群中播散的主要机制。中性检验显示,四个人群β-珠蛋白基因的π和θ值相差较大,Tajima’D值均为正值(P<0.05),表明四个人群β-珠蛋白基因的常见SNP位点增多。同时,我们还观察到47种单倍型中存在三种主要单倍型,而且这三种单倍型之间的核苷酸差异比较大,表明这些人群的β-珠蛋白基因存在两个以上频率较高的等位基因,提示β-珠蛋白基因受到平衡选择的作用。根据史料,其结果可能与疟疾选择作用相关。我们推测β-地贫基因CD41-42(-CTTT)突变可能首先发生于长期居住在疟疾流行的广西境内、广东西部等地区的骆越群体中,然后由于受到疟疾的选择作用,在人群中达到多态性水平。除了疟疾选择作用外,漂变和人群迁徙也可能是造成目前CD41-42(-CTTT)突变分布格局的原因。我们在Net-Work系统树中观察到黎族人群中的绝大部分CD41-42(-CTTT)突变单倍型HP20均由HP3发生4-bp缺失突变衍生而成,其单倍型的起源和结构上的单一性表明,黎族人群的CD41-42(-CTTT)突变的发生和分布符合建立者效应。与汉族和壮族比较,黎族人群体较小,而且是一个相对隔离的人群,建立者效应和人口的快速增长可以解释这一致病基因的频率增长,即使该群体中少数始祖所具有的CD41-42(-CTTT)突变基因逐渐达到较高水平。而在海南汉族、广西汉族和广西壮族人群的CD41-42(-CTTT)突变的单倍型中,我们没有观察到建立者效应。由于汉族和壮族的群体较大,遗传漂变可能导致CD41-42(-CTTT)突变的等位基因频率逐渐降低或变动不大。历史上,我国人群的迁徙主要是自北往南迁,而南方的群体很少往北迁;广西汉族是在不同时期从北方逐渐迁徙到广西的,而壮族基本上没有往北迁徙,汉族与壮族曾发生比较频繁的基因交流。这种基因流的走向可能是形成目前广西汉族和壮族人群中CD41-42(-CTTT)突变分布格局的重要因素。历史上海南汉族人迁徙到海南晚于黎族人的迁徙,其β-地贫的突变谱、CD41-42(-CTTT)突变的携带率及该突变的单倍型分布与黎族人不同,但与广西、广东地区人群相似,提示海南汉族人群的CD41-42(-CTTT)突变可能是随着汉族迁入海南过程中带入海南汉族群体,该突变在汉族人群迁徙至海南之前已经发生,汉族人群与黎族人群之间的基因交流对海南汉族人群的CD41-42(-CTTT)突变的贡献可能较小。遗传漂变可能也是影响海南汉族人群CD41-42(-CTTT)突变频率的重要因素。此外,我们还分析了四个人群β-珠蛋白基因单核苷酸多态性的杂合度及分化指数,结果表明β-珠蛋白基因的遗传结构没有分化。结论1.根据人群单倍型的特点、LD类型、Four Gamete结果以及重组和突变或缺失发生的机率,结合黎族人群与壮族人群的起源和分化的时间以及黎族迁徙史,我们推测中国人群的CD41-42(-CTTT)突变可能是单一起源,发生在黎族和壮族人群分化之前,至少已有3000的历史,CD41-42(-CTTT)缺失突变单倍型HP20可能是最早出现的单倍型,然后在人群传播过程中,通过基因转换的方式产生HP47。2.连锁不平衡和遗传多样性分析结果表明海南汉族、海南黎族、广西汉族和广西壮族人群的β-珠蛋白基因在进化过程中受到平衡选择的作用,可能与疟疾选择作用相关。疟疾选择作用可能是造成我国南方地区人群β-地贫携带率高于北方人群的重要原因之一。3.建立者效应可能是黎族人群CD41-42(-CTTT)突变携带率增高的重要原因。遗传漂变可能是导致海南汉族、广西汉族和广西壮族人群CD41-42(-CTTT)突变携带率低于黎族人群的原因之一。4.人群迁徙也是影响海南汉族、广西汉族和广西壮族人群CD41-42(-CTTT)突变分布的因素之一。广西汉族人群和广西壮族人群之间的CD41-42(-CTTT)突变可能是由于两个民族之间基因交流的结果,而海南汉族人群的CD41-42(-CTTT)突变是随着汉族迁入海南带入汉族群体,汉族人群与黎族人群之间基因交流的贡献可能较小。5.四个人群的β-珠蛋白基因的遗传结构非常相似,没有发生分化。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第1章 引言
  • 第2章 材料和方法
  • 2.1 仪器
  • 2.2 试剂
  • 2.2.1 外周血基因组DNA提取试剂
  • 2.2.2 反向点杂交实验试剂
  • 2.2.3 电泳试剂
  • 2.3 本研究所采取的技术路线
  • 2.4 样品的采集
  • 2.4.1 广西壮族和样本汉族人群样品的采集
  • 2.4.2 海南汉族人群样品的采集
  • 2.4.3 海南黎族人群样品的采集
  • 2.4.4 CD41-42(-CTTT)突变纯合子样品的采集
  • 2.5 β-地贫血液学表型的筛查
  • 2.5.1 红细胞参数分析
  • 2.5.2 血红蛋白电泳
  • 2.6 外周血基因组DNA的提取
  • 2.6.1 磁珠法
  • 2.6.2 盐析法
  • 2.7 β-地贫突变的筛查
  • 2.7.1 海南黎族人群β-地贫突变的筛查
  • 2.7.2 广西壮族和汉族人群β-地贫突变的筛查
  • 2.7.3 海南汉族人群β-地贫突变的检测
  • 2.8 β-珠蛋白基因单核苷酸多态性的检测
  • 2.9 统计学分析
  • 2.9.1 Hardy-Weinberg平衡吻合度检验
  • 2.9.2 等位基因频率和单倍型频率的比较
  • 2.9.3 各个人群之间各种CD41-42(-CTTT)突变单倍型频率的比较
  • 2.9.4 各个人群之间单核苷酸多态性杂合度差异的比较
  • 2.10 遗传学数据分析
  • 2.10.1 单倍型分析
  • 2.10.2 Four-Gamete分析
  • 2.10.3 连锁不平衡分析
  • 2.10.4 核苷酸多样性的估算和中性检验
  • 2.10.5 单倍型网络图(Net-Work)的构建
  • 2.10.6 单核苷酸多态性杂合度及人群分化指数的计算
  • 第3章 实验结果
  • 3.1 β-地贫突变的筛查结果
  • 3.1.1 黎族人群样品中β-地贫突变的筛查结果和CD41-42(-CTTT)突变携带率
  • 3.1.2 广西壮族和汉族人群样品中CD41-42(-CTTT)突变携带率
  • 3.1.2.1 反向点杂交结果
  • 3.1.2.2 广西壮族和汉族人群中CD41-42(-CTTT)突变携带率
  • 3.1.3 海南汉族人群样品中CD41-42(-CTTT)突变携带率
  • 3.2 β-珠蛋白基因的扩增及DNA测序结果
  • 3.2.1 PCR扩增β-珠蛋白基因结果
  • 3.2.2 β-珠蛋白基因的DNA测序结果
  • 3.3 海南汉族、海南黎族、广西汉族和壮族人群14个SNPs位点的基因型的Hardy-Weinberg平衡检验结果
  • 3.4 海南汉族、海南黎族、广西汉族和壮族人群14个SNPs位点的等位基因频率比较
  • 3.5 遗传学数据分析结果
  • 3.5.1 单倍型分析结果
  • 3.5.2 Four Gamete分析结果
  • 3.5.3 连锁不平衡分析结果
  • 3.5.4 核苷酸多样性的估算和中性检验分析结果
  • 3.5.5 单倍型网络图分析结果
  • 3.5.6 单核苷酸多态性杂合度及人群分化指数的计算结果
  • 第4章 分析与讨论
  • 4.1 百越民族与壮族、黎族的起源的关系
  • 4.2 海南黎族、海南汉族、广西壮族和广西汉族人群的群体结构
  • 4.3 海南黎族、海南汉族、广西壮族和广西汉族人群CD41-42(-CTTT)突变的起源
  • 4.4 β—珠蛋白基因单倍型和CD41-42(-CTTT)突变的分布与自然选择作用的关系
  • 4.4.1 自然选择作用
  • 4.4.1.1 分子进化的中性进化学说和自然选择学说及中性检验
  • 4.4.1.2 β—珠蛋白基因单倍型分布与自然选择作用的关系
  • 4.4.2 遗传漂变
  • 4.4.3 人群迁徙
  • 4.4.4 基因转换
  • 4.5 小结
  • 第5章 参考文献
  • 攻读博士学位期间所发表论文
  • 致谢
  • 英文缩略词表
  • 相关论文文献

    • [1].清远地区CD41-42β地中海贫血人群基因型组合特点及红细胞参数特点分析[J]. 广东医学 2015(03)
    • [2].β-地中海贫血CD41-42型突变基因重组载体的构建[J]. 中国妇幼保健 2013(26)
    • [3].人β-地中海贫血CD41-42型突变基因慢病毒载体的构建和293T的转染[J]. 中国妇幼保健 2014(05)
    • [4].CD41-42突变型β地中海贫血重组载体pEGFP-C2-CD41-42的构建及其稳定转染HeLa细胞模型的建立[J]. 吉林大学学报(医学版) 2014(02)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    中国南方人群β-地中海贫血CD41-42(-CTTT)突变的起源与扩散的群体遗传学研究
    下载Doc文档

    猜你喜欢