奶牛重要经济性状的全基因组关联分析

奶牛重要经济性状的全基因组关联分析

论文摘要

大多数奶牛重要经济性状如产奶量、乳脂量、乳蛋白量等属于受大量基因和诸多环境因素共同影响的数量性状。对影响奶牛重要经济性状遗传变异的鉴定不仅有利于揭示奶牛数量性状的遗传学机制,还能帮助我们理解长期以来的高强度定向选择对奶牛群体遗传特征的影响,同时为制定和完善奶牛育种目标提供参考。由人类遗传学家提出的全基因组关联分析方法,旨在充分利用群体水平的连锁不平衡,在全基因组内筛查影响表型变异的遗传位点。随着各物种高密度SNP芯片技术的不断发展,全基因组关联分析方法又被广泛地应用到各种家养动植物和模式生物数量性状的遗传研究中。本研究利用国际公牛评定中心(Uppsala, Sweden)收集的瑞士褐牛后裔验证公牛估计育种值数据和Illumina50K SNP芯片(共包括54001个SNPs探针)全基因组SNPs分型数据资料,主要采用单标记线性混合模型方法,对产奶量(n=5043)、乳脂量(n=5043)、乳蛋白量(n=5043)、泌乳母牛的产犊循环能力(n=3807)、体高(n=4610)、体深(n=4402)、棱角性(n=2061)、体细胞评分(n=4803)、泌乳速度(n=4411)九个重要经济性状进行全基因组关联分析,旨在定位影响上述性状的QTL。获得的主要研究结果如下:1.样本群体混杂因素的分析采用主成分分析和简单线性回归模型,探讨样本群体是否存在群体分层风险以及混杂因素对关联结果的干扰程度。结果表明:在本研究中,群体分层并不是主要的群体混杂因素,因此在后续的关联分析中该因素可以被忽略。而高强度的家系亲缘关系才是主要的混杂因素,而且对关联结果的干扰程度非常大。2.线性混合模型的全基因组关联分析应用单标记线性混合模型进行全基因关联分析,结果表明应用线性混合模型能很好地校正本样本群体中存在的混杂因素,尤其是各性状的关联P值的λ1000非常接近于1.05,表明通胀程度很微弱。在线型混合模型关联分析的基础上,应用基因组控制的方法,共检测到74个分布在12条染色体上与九个性状呈现全基国组显著关联的SNP,且多个显著性SNP聚集形成四个显著的关联区域。其中24个SNP与多个性状同时关联,剩余的50个SNP仅与某一种性状关联。3.产奶量等性状的条件全基因组关联分析以检测到的最显著关联的SNP和体高的估计育种值分别作为协变量对产奶量、乳脂量、乳蛋白量、体高、体深五个性状进行GWAS分析,探索第25号染色体上多重关联区域出现的遗传学原因。结果表明:该区域内仅存在一个QTL而且该QTL具有一因多效性。4.泌乳性状和体高遗传方差的染色体剖分利用遗传方差的染色体剖分方法,估计所有染色体及每条染色体能解释性状表型方差的比率。结果表明:对于泌乳性状和体高常染色体能解释非常大比率的表型方差。同时,线性回归分析表明:染色体解释表型方差的比率与染色体物理长度呈现较弱的正相关关系。总体来说,牛的泌乳性状和体高符合微效多基因遗传模式。5.显著关联区域的功能注释采用AnnotQTL对四个关联区域进行功能注释,结合已有的研究报道,IGFALS基因被确定为是影响奶牛泌乳性状和体高的重要候选基因,而IL-8被初步确定为影响泌乳速度的候选基因。本研究表明全基因组关联分析是一种高效的定位家养动物复杂性状QTL的研究方法。本研究共定位到分布在12条染色体上74个显著关联的SNPs,尤其四个分别位于牛6、11、24和25号染色体上显著性关联区域。上述关联区域所涵盖的一些基因可被视作候选基因(例如,IGFALS, IL-8),值得进行后续研究,以其全面揭示该QTL作用的分子遗传机制。遗传方差的染色体剖分结果表明牛的泌乳性状和体高符合微效多基因遗传模式。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 文献综述
  • 1.1 前言
  • 1.2 标记-QTL连锁分析
  • 1.2.1 遗传标记和遗传图谱
  • 1.2.2 资源群体
  • 1.2.3 QTL-标记连锁分析的统计方法
  • 1.2.4 家养动物数量性状连锁分析的主要成果
  • 1.3 全基因组关联研究
  • 1.3.1 全基因组关联研究的历史背景
  • 1.3.2 全基因组关联研究方法的发展
  • 1.3.3 全基因组关联分析的样本量估计
  • 1.3.4 全基因组关联分析与失踪遗传力
  • 1.3.5 奶牛全基因组关联分析研究进展
  • 1.4 QTN分析的挑战
  • 1.5 研究目的与意义
  • 第二章 样本群体混杂因素的分析
  • 2.1 材料与方法
  • 2.1.1 资源群体
  • 2.1.2 基因组通胀的检测
  • 2.1.3 关联分析的统计推断
  • 2.2 结果与分析
  • 2.2.1 表型信息的总结
  • 2.2.2 SNP芯片的基因分型结果
  • 2.2.3 群体混杂因素的调查
  • 2.3 讨论
  • 2.3.1 样本规模对数量性状GWAS分析的影响
  • 2.3.2 样本群体混杂因素的分析
  • 2.4 小结
  • 第三章 线性混合模型的全基因组关联分析
  • 3.1 材料与方法
  • 3.1.1 样本群体
  • 3.1.2 关联分析的统计模型
  • 3.2 结果与分析
  • 3.2.1 线性混合模型关联结果的通胀程度
  • 3.2.2 线性混合模型的关联分析结果
  • 3.3 讨论
  • 3.3.1 数量性状GWAS分析的线性混合模型方法
  • 3.3.2 估计育种值作为响应变量的优势
  • 3.3.3 关联结果与报道结果的比较
  • 3.3.4 泌乳性状的微效多基因遗传机制
  • 3.4 小结
  • 第四章 条件全基因组关联分析
  • 4.1 材料与方法
  • 4.1.1 样本群体
  • 4.1.2 条件关联分析的统计模型
  • 4.2 结果与分析
  • 4.2.1 最显著SNP作为协变量的关联分析结果
  • 4.2.2 体高育种值作为协变量的关联分析结果
  • 4.3 讨论
  • 4.3.1 最显著SNP作为协变量的条件关联分析
  • 4.3.2 体高育种值作为协变量的条件关联分析
  • 4.4 小结
  • 第五章 泌乳性状和体高遗传方差的染色体剖分
  • 5.1 材料与方法
  • 5.1.1 样本数据
  • 5.1.2 遗传方差估计的统计模型
  • 5.1.3 染色体长度与遗传方差的相关性分析
  • 5.2 结果与分析
  • 5.2.1 常染色体上SNPs共同解释的表型方差
  • 5.2.2 每条常染色体上SNPs解释的表型方差
  • 5.2.3 常染色体解释表型方差的线性回归分析
  • 5.3 讨论
  • 5.3.1 泌乳性状和体高的微效多基因遗传模式
  • 5.3.2 染色体遗传方差与QTL定位结果比较
  • 5.4 小结
  • 第六章 关联结果的生物信息学功能注释
  • 6.1 材料与方法
  • 6.1.1 功能注释的关联区域
  • 6.1.2 注释工具与原理
  • 6.2 结果与分析
  • 6.2.1 与泌乳速度关联的主要区域的注释
  • 6.2.2 与棱角性关联的主要区域的注释
  • 6.2.3 与体细胞评分关联的主要区域的注释
  • 6.2.4 与体高等关联的主要区域的注释
  • 6.3 讨论
  • 6.3.1 主要关联区域注释结果的讨论
  • 6.3.2 生长激素-胰岛素样生长因子-I轴基因
  • 6.4 小结
  • 第七章 结论
  • 7.1 主要结论
  • 7.2 本研究的创新点
  • 7.3 进一步研究内容
  • 7.4 展望
  • 参考文献
  • 附录
  • 致谢
  • 个人简介
  • 相关论文文献

    标签:;  ;  ;  ;  

    奶牛重要经济性状的全基因组关联分析
    下载Doc文档

    猜你喜欢