论文摘要
本文利用迄今为止最大规模、高密度的全基因组常染色体单核苷酸多态性数据,对分布在四个大洲(亚洲,欧洲,美洲和非洲)和太平洋岛屿的共40个群体的遗传结构作了比较系统的研究。结果发现人群遗传结构的产生和形成过程中,地理因素占据最主要的地位。亚洲、非洲和欧洲三个大洲的人群以及太平洋岛屿人群在聚类树上形成明显的分支。大洲内部的人群之间,也基本上按照地理分布形成相应的聚类分支。对于亚洲、非洲和欧洲三个大洲的人群来说,绝大部分的遗传变异来自群体内部(85.6%);大洲内部群体之间的遗传差异只占总体遗传差异很小的比例(1.2%);但大洲之间的人群的遗传差异还是有相对比较高的比例(13.2%)。考察遗传变异在东南亚的六大语系人群中的分布比例,同样,变异的主要来自于群体内部(95.76%),但与大洲之间的人群变异模式不一样的是,语系内的群体间的遗传差异所占的比例(3.22%)要大于语系间遗传差异所占的比例(1.02%),语系的划分布在一定程度上能得到遗传学证据的支持。然而,人群的遗传关系跟目前语言学研究得到结果不是一一对应的,比如与佤族同属南亚语系孟高棉语族的Kensiu和Jehai与佤族的遗传关系相对较远,而南岛语系马来语族的Bidayuh和Temuan却与佤族的遗传关系更接近一些。语系归属在语言学界存在争论的壮族和苗族,与汉族人之间的遗传关系比较密切,在聚类树上及MDS图上的位置相当接近;但AMOVA的分析结果表明,民族间的遗传差异还是要大于民族内地理群体间的差异。汉藏语系中的汉语族与藏缅语族人群,遗传关系非常密切,AMOVA的分析结果表明,变异的主要来自于群体内部(98.16%),语族内的群体间的遗传差异所占的比例(1.28%)要大于语族间遗传差异所占的比例(0.56%)。对亚洲四个国家15个人群的遗传结构分析结果表明,至少有9个可以识别的遗传亚结构存在,中国的壮族、苗族、佤族、基诺族、维吾尔族、汉族,马来西亚的Bidayuh、Temuan、Jehai、Kensiu都具有不同的遗传结构,彼此都可以明确区分;但是韩国人、日本人以及琉球岛人的遗传结构非常相似,往往不能区分彼此。汉族人(HAN)实际上存在很高的混合遗传成分,占优势的有两种成分,一种属于壮族的主要成分,一种属于韩国人、日本人等共有的主要遗传成分,并且两种成分在汉族人群中的比例相当,前者占30.9%,后者占34.4%。汉族人还有其他的遗传成分混合,苗族的主要成分在其中占12%。本文从"LD block"的角度,考察了11个人群的连锁不平衡在21号染色体上的分布状况。结果提示,连锁不平衡分布的差异是群体遗传结构的一个重要反映。非洲人群与非非洲人群的"LD block"分布有很大差异,可以看出由于人群历史的不同产生的明显分离。亚洲人群与欧洲人群也有较大的差异,亚洲人群的LD block整体上比欧洲人群更有优势,这表现在亚洲人群的block的平均长度以及最大长度都高于欧洲人群,block区域在染色体上的覆盖率也是亚洲人群高一些。亚洲人群中,南方少数民族苗族和佤族的LD block比其他人群都有优势,表现在苗族和佤族的block的平均长度以及最大长度都高于其他亚洲人群,block区域在染色体上的覆盖率也是苗族和佤族高一些。尽管没有改变总体的模式,位点频率对LD block的划分结果有不可忽略的影响。表现在block的数目减少,长度增加,染色体覆盖率降低。混合人群的LD block在所有情况下都比其可能的亲本群体,比如美国黑人相对于非洲黑人和欧洲白人,维吾尔族相对于欧洲人群和亚洲人群,block长度更短,染色体覆盖率更低。鉴于混合人群与隔离人群在人群历史、进化研究以及复杂疾病研究中的重要地位,本文对两个典型的混合人群,美国黑人、中国维吾尔族以及一个典型的隔离人群,萨摩亚人的遗传结构尤其是其特殊的连锁不平衡结构进行了细致的解析。美国黑人的遗传杂合度比一般人群杂合度要高,观察到的美国黑人的平均杂合度为0.311,非洲黑人为0.296,美国白人为0.290。遗传杂合度的增加是混合人群的一个典型特征。美国黑人个体混合程度变异很大,有的个体的染色体几乎全部来源于非洲黑人祖先群体,有的个体则具有不同程度的双亲群体成份。但没有发现染色体完全来源于欧洲白人的个体,至少在本文使用的样本是这样。美国黑人个体的染色体之间混合程度的相关性很强,在一条染色体上观察到的混合比例与其他染色体或整个基因组的混合比例是相当一致的,组内相关系数高达0.958。如果位点不经挑选,整体上看,美国黑人的连锁不平衡强度和模式与非洲黑人的几乎没有差别。然而,实际上美国黑人具有比其双亲群体延长的连锁不平衡。这种延长的连锁不平衡只有在富含祖先信息的位点(AIMs)中才能明显地观察到。通过大量位点地分析和筛选,结果表明f≥0.4是挑选信息位点的一个比较好的标准。连锁不平衡在美国黑人人群的增强和延伸主要发生在间距大于200kb的位点之间,并且LD水平局限在0.1<r~2<0.8范围。在间距小于200kb的位点之间,与其双亲群体相比,美国黑人的LD不占优势。"extended LD"是近期产生的混合人群的又一典型特点。不同混合程度的美国黑人个体对连锁不平衡有不同的影响。染色体完全来源于非洲黑人祖先群体的个体对"extended LD"的贡献很小,主要的贡献来自于那些具有显著的双方祖先群体遗传成份的个体。中国新疆和田维吾尔族群体无疑是一个含有欧洲白人遗传成分和亚洲人遗传成分的混合人群。根据22条常染色体SNP数据的估计,其中欧洲白人成份占52.1%,亚洲人成份占47.9%。因此和田维吾尔族在遗传上更接近欧洲白人。维吾尔族的遗传杂合度比美国白人和亚洲人的杂合度略高。观察到的维吾尔族的位点平均杂合度为0.309,美国白人为0.301,北京汉族为0.284。遗传杂合度的增加也是支持维吾尔族是混合人群的一个证据。与在美国黑人群体中看到的情况相比,维吾尔族个体混合程度变异较小,从22条常染色体的数据估计出的结果是,最小值44.4%,最大值61.8%。根据从常染色体SNP数据得到的重组率,在维吾尔族群体是一次混合事件产生的假设前提下,估计维吾尔族的混合发生在92个世代之前,或者1840年以前。这个时间比人类学方面的资料显示的时间提前了很多。根据从21号染色体的SNP数据得到的结果,与美国白人群体(CEU)以及北京汉族群体(CHB)相比,在r~2≥0.5的水平,维吾尔族的连锁不平衡完全不占优势,即使位点经过挑选也是这样,低水平的连锁不平衡也只有微弱的优势。与美国黑人群体分析中观察到的结果一致,r~2≥0.8的连锁不平衡延伸不超过200kb。萨摩亚人群具有更多的低频SNP位点,位点平均杂合度比普通人群低,这个结果符合隔离人群的特征。在"走出非洲"假说的前提下,萨摩亚人群位于"走出非洲"路线的末端,与欧洲人群的遗传距离较远。本文的分析结果表明萨摩亚人群混有欧洲白人成分的可能性很小。尽管长的连锁不平衡具有相当的吸引力,但是在萨摩亚人群中,连锁不平衡的增强主要发生在200kb以内的距离范围,这一点刚好与前文讨论的混合人群如美国黑人的情况相反。连锁不平衡受位点频率的很大影响,至少在用r~2度量的时候,萨摩亚人群的连锁不平衡在高频位点(MAF≥0.15)比普通人群有更加明显的提高。对于高频位点(MAF≥0.15)来讲,在200kb的范围内,强的连锁不平衡(r~2≥0.8)总是Samoan的比例最高,平均来讲,是CEU的2.66倍,是CHB的2.33倍;稍弱的连锁不平衡(1/3≤r~2<0.5)在Samoan中的增强发生在30kb以外的距离范围;更弱的连锁不平衡(0.1≤r~2<1/3)在Samoan中的增强发生在50kb以外的范围,这个水平的连锁不平衡也不比普通人群延伸得更远,或者说普通人群和Samoan一样延伸到很远的距离。
论文目录
相关论文文献
- [1].基于马尾松转录组测序的产脂相关SNPs初步分析[J]. 广西林业科学 2020(02)
- [2].10个SNPs与京海黄鸡生长性状的关联性分析[J]. 中国兽医学报 2015(12)
- [3].维生素D受体SNPs基因多态性与新疆汉族2型糖尿病视网膜病变相关性研究[J]. 新疆医科大学学报 2016(09)
- [4].大口黑鲈转录组SNPs筛选及其与生长的关联分析[J]. 水生生物学报 2016(06)
- [5].基于基因组SNPs的南极恩克斯堡岛阿德利企鹅繁殖种群的遗传结构[J]. 生物多样性 2019(12)
- [6].西安市30~36月龄幼儿肥胖遗传度及4个SNPs位点多态性分析[J]. 中国当代儿科杂志 2020(04)
- [7].The Association between LINC00511 Variants and Breast Cancer Susceptibility among the Han Chinese Population[J]. Journal of Nutritional Oncology 2020(02)
- [8].肌联蛋白基因SNPs位点多态性与延边黄牛生长性状间的关联分析[J]. 畜牧与兽医 2017(10)
- [9].脑源性神经营养因子基因3个SNPs位点与精神分裂症的相关性[J]. 宁夏医科大学学报 2010(09)
- [10].金定鸭卵巢组织转录组SNPs和可变剪接分析[J]. 中国家禽 2020(02)
- [11].GnRH基因SNPs与鹅体组成和蛋品质性状的关联分析[J]. 中国畜牧杂志 2020(10)
- [12].Association of single nucleotide polymorphisms of tissue factor and tissue factor pathway inhibitor with venous thromboembolism in patients with lung cancer[J]. China Medical Abstracts(Internal Medicine) 2018(02)
- [13].新疆褐牛产奶性状候选基因SNPs检测及其遗传效应分析[J]. 中国农学通报 2017(20)
- [14].随机森林方法在致病SNPs检测中的应用[J]. 世界科技研究与发展 2012(04)
- [15].Identification of a combination of SNPs associated with Graves' disease using swarm intelligence[J]. Science China(Life Sciences) 2011(02)
- [16].Differences in clinical and genetic characteristics between early-and late-onset narcolepsy in a Han Chinese cohort[J]. Neural Regeneration Research 2020(10)
- [17].美洲水貂刺鼠信号蛋白基因SNPs检测及其与毛色表型的关联分析[J]. 畜牧兽医学报 2016(04)
- [18].中国一短指畸形家系20p12.2-12.3中非编码区的SNPs报道[J]. 中国优生与遗传杂志 2013(07)
- [19].基于GBS技术的新杨绿壳纯系蛋鸡SNPs检测[J]. 中国家禽 2018(13)
- [20].太平洋牡蛎HSP70基因SNPs开发及其与温度相关性分析[J]. 广东海洋大学学报 2017(03)
- [21].翘嘴鳜淀粉酶基因SNPs和微卫星位点多态性的检测[J]. 暨南大学学报(自然科学与医学版) 2013(01)
- [22].Identification of SNPs and Their Effects on Swine Growth and Carcass Traits for Porcine IGFBP-3 Gene[J]. Agricultural Sciences in China 2008(05)
- [23].Relationship between glucokinase gene 6 tag single nucleotide polymorphism sites and type 2 diabetes mellitus[J]. China Medical Abstracts(Internal Medicine) 2016(01)
- [24].小型猪生长激素基因启动子区SNPs分析[J]. 畜牧兽医学报 2009(05)
- [25].结肠癌中奥沙利铂毒性和耐药性相关基因SNPs的研究进展[J]. 临床与病理杂志 2014(06)
- [26].肿瘤坏死因子基因6个SNPs与河南汉族原发性高血压的相关性研究[J]. 中国慢性病预防与控制 2011(06)
- [27].凡纳滨对虾α-淀粉酶基因的SNPs检测[J]. 水产科学 2008(07)
- [28].贵妃鸡肌细胞生成素基因SNPs检测及其与屠宰性状的相关性分析[J]. 中国畜牧兽医 2013(11)
- [29].个体识别SNPs位点组合筛选与法医学应用价值初探[J]. 中国法医学杂志 2014(02)
- [30].β_2肾上腺素受体基因5个位点SNPs与河南汉族原发性高血压关系的研究[J]. 中国慢性病预防与控制 2010(04)