基于贝叶斯统计的谷物胚乳性状QTL作图方法

基于贝叶斯统计的谷物胚乳性状QTL作图方法

论文摘要

谷类作物种子的胚乳是人类食物的重要来源,胚乳性状的遗传研究是粮食增产和品质改良的必要前提。随着分子标记技术的成熟以及饱和分子标记连锁图的建成,追踪并定位控制数量性状的多个基因座位已成为可能,进而为育种学家研究如何提高粮食产量、改善粮食品质提供了有力的工具。由于种子胚乳遗传控制体系要比通常的二倍体农艺性状更为复杂,种子胚乳性状研究不应该直接套用常规二倍体农艺性状作图方法。为此,研究人员先后提出一系列基于经典数理统计方法的胚乳性状QTL专用模型和方法,如极大似然法,迭代重新加权最小平方法等,以解析胚乳数量性状的遗传结构。近十年来,随着现代统计学、高速计算机的发展以及马尔可夫链蒙特卡罗(MCMC)算法的提出,贝叶斯统计以其鲜明的特点和独到的分析方法,引起了研究者的重视。在数量遗传学研究中,如何将贝叶斯统计学原理和方法应用于三倍体胚乳性状的QTL作图,在国内外尚未见报道。因此,本研究率先将贝叶斯统计原理和胚乳性状的数量遗传模型相结合,以分离群体中各植株的分子标记基因型以及植株上若干粒种子胚乳性状的单粒观测值为数据模式,根据胚乳性状的遗传特点,提出了一种新的基于贝叶斯统计的胚乳性状QTL作图方法,该方法采用基于马尔可夫链蒙特卡罗算法实现的贝叶斯方法估计QTL的遗传参数。该方法基本过程如下:(1)构建胚乳性状QTL的遗传模型;(2)利用分离群体的分子标记基因型信息,推断种子胚乳QTL基因型的条件概率;(3)依据贝叶斯公式,利用QTL基因型的条件概率和种子性状表型观察值计算各QTL基因型的条件后验概率,获得该粒种子胚乳基因型,从而确定模型中指示变量的取值;(4)根据贝叶斯公式推导出模型中各参数的条件后验分布,包括:平均值、加性效应、第一显性、第二显性效应以及误差方差;(5)利用各参数的条件后验分布,采用基于Gibbs抽样和Metropolis-Hastings算法实现的马尔可夫链蒙特卡罗(MCMC)方法同时获得多个QTL效应和位置的后验样本;(6)收集并分析后验样本,依据后验样本分布特征,选取平均数或众数作为相应参数的贝叶斯估计值。本研究以分离群体中各植株的分子标记基因型以及植株上若干粒种子胚乳性状的单粒观测值为数据模式,首先发展出基于单QTL模型的谷物胚乳性状QTL区间作图的贝叶斯方法。方法的有效性用染色体水平和基因组水平两套模拟方案进行验证。在上述研究的基础上,本研究进一步以相同的数据模式,提出了胚乳数量性状基因座(QTL)多区间作图的贝叶斯方法,方法的有效性通过模拟实验进行了验证。模拟实验设置和分析结果报告如下:方法1:基于单QTL模型的胚乳性状QTL作图的贝叶斯方法模拟设置1:染色体水平模拟。设F2分离群体的样本容量为200株,每株考察20粒。QTL遗传力h2设置5%、10%和20%,共3个水平。每处理重复模拟100次,QTL位置和效应估计的准确度以100个重复样本相应QTL位置和效应估计值‘的平均值度量,精确度则以100个重复样本相应QTL估计值的标准差度量。模拟设置2:基因组水平模拟。研究中采用了一个包含4条染色体的全基因组,4个具有不同遗传效应的QTL,分布在各个染色体上,QTL的遗传力分别为6.07%,16.77%,23.96%和13.21%。模拟结果表明:(1)各遗传力下QTL的统计功效均为100%。(2)在遗传力分别为5%、10%、20%三种处理下,QTL位置估计值的准确度均很高,三种遗传力下相差很小,而精确度却随遗传力的增加而提高。(3)在群体均值和QTL效应估计值上,尤其是两个显性效应的估计值,随着遗传力的增加,估计值的准确度和精确度也随之提高,这与一般期望相符。(4)在全基因组水平下,本研究提出的方法可以清晰地分辨出4个不同QTL所在的基因组位置,并准确估计各个QTL的有关参数。方法2:基于贝叶斯统计的谷物胚乳性状QTL多区间作图法模拟设置:设F2分离群体的样本容量为200株,每株考察30粒。假设一条长100cM的染色体,其上均匀分布11个共显性分子标记,控制胚乳性状的3个QTL分别位于15cM,55cM和95cM处,群体均值设为20,各个QTL的遗传力分别接近5%、10%和15%。重复模拟100次,QTL位置和效应估计的准确度和精确度度量方法同上。模拟结果:(1)贝叶斯方法可以高效发现QTL并准确估计出QTL的遗传位置。例如,在本研究模拟设置下,即使是遗传力只有5%左右的QTL,其统计功效也达100%。此外,贝叶斯多区间方法对群体均值和加性效应的估计也十分准确。(2)从QTL效应估计的准确度以及精确度来看,只有两个显性效应的准确度略差。这一方面可能与模拟试验采用的群体有关,由于本方案采用一阶设计的F2群体,F3胚乳QTL基因型以其所着生的母株QTL基因型推断,由于世代的不对应,必然会造成一定的信息丢失。另一方面,即使加性和显性效应在量值上相等,显性效应引起的变异在胚乳性状遗传方差中所占分量仍然相对很小。

论文目录

  • 符号说明
  • 中文摘要
  • ABSTRACT
  • 第1章 种子性状遗传研究进展
  • 1.0 摘要
  • 1.1 前言
  • 1.2 种子性状遗传特性
  • 1.2.1 高等植物的双受精现象
  • 1.2.2 种子性状的遗传特征
  • 1.3 种子性状的遗传效应
  • 1.3.1 核基因效应
  • 1.3.2 母体效应
  • 1.3.3 细胞质效应
  • 1.3.4 印迹效应
  • 1.4 种子性状遗传基础研究进展
  • 1.4.1 种子胚性状遗传研究
  • 1.4.2 种子胚乳性状遗传研究
  • 1.4.3 种子产量和休眠特性的遗传研究
  • 1.5 存在的问题及展望
  • 参考文献
  • 第2章 复杂胚乳性状的遗传解析
  • 2.0 摘要
  • 2.1 前言
  • 2.2 胚乳性状的数量遗传模型和试验设计
  • 2.2.1 双受精和3N胚乳的遗传组成
  • 2.2.2 胚乳性状的数量遗传模型
  • 2.2.3 3N胚乳性状遗传研究常用的试验设计
  • 2.3 3N胚乳性状QTL作图的主要方法及特点
  • 2.3.1 最小平方法
  • 2.3.2 迭代重新加权最小平方法
  • 2.3.3 极大似然法
  • 2.4 胚乳发育性状研究进展
  • 2.5 胚乳性状母体效应研究进展
  • 2.6 胚乳性状基因印迹研究进展
  • 2.7 展望
  • 参考文献
  • 第3章 贝叶斯统计及其在QTL作图上的应用研究进展
  • 3.0 摘要
  • 3.1 前言
  • 3.2 贝叶斯统计
  • 3.2.1 贝叶斯公式
  • 3.2.2 先验分布与后验分布
  • 3.3 马尔可夫链蒙特卡罗方法(MCMC方法)
  • 3.3.1 Gibbs抽样
  • 3.3.2 Metropolis-Hastings抽样
  • 3.4 贝叶斯统计的应用策略
  • 3.5 贝叶斯统计在QTL作图中的应用
  • 3.5.1 单QTL作图
  • 3.5.2 多QTL作图
  • 3.6 展望
  • 参考文献
  • 第4章 谷物胚乳性状QTL区间作图的贝叶斯方法
  • 4.0 摘要
  • 4.1 前言
  • 4.2 原理和方法
  • 4.2.1 胚乳性状的统计遗传模型
  • 4.2.2 模型参数的后验分布
  • 4.2.3 MCMC算法
  • 4.2.4 后验样本分析
  • 4.3 模拟研究
  • 4.3.1 模拟设置
  • 4.3.2 模拟结果
  • 4.4 讨论
  • 参考文献
  • 第5章 基于贝叶斯统计的谷物胚乳性状QTL多区间作图方法
  • 5.0 摘要
  • 5.1 前言
  • 5.2 原理和方法
  • 5.2.1 胚乳性状的统计遗传模型
  • 5.2.2 模型参数的条件后验分布
  • 5.2.3 MCMC过程
  • 5.3 模拟研究
  • 5.3.1 模拟设置
  • 5.3.2 模拟结果
  • 5.4 讨论
  • 5.5 结论
  • 参考文献
  • 第6章 胚乳性状QTL作图的贝叶斯方法模拟程序
  • 6.1 程序说明
  • 6.2 群体表型和基因型数据生成
  • 6.3 模拟研究核心程序
  • 6.4 后验样本分析程序
  • 存在问题与下一步研究设想
  • 致谢
  • 博士期间发表论文情况
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于贝叶斯统计的谷物胚乳性状QTL作图方法
    下载Doc文档

    猜你喜欢