两个芸薹属二倍体物种及其异源四倍体转座元件的鉴定、比较和进化分析

两个芸薹属二倍体物种及其异源四倍体转座元件的鉴定、比较和进化分析

论文摘要

二倍体的白菜、甘蓝以及它们的异源四倍体甘蓝型油菜是我国重要的蔬菜和油料作物,它们之间遗传关系是我们研究芸薹属进化的基础。转座元件或转座子是大多数真核生物基因组的主要组成成分。除了多倍体化外,转座子的大规模扩增是造成植物基因组快速膨胀的主要因素。转座子不仅仅是基因组进化的传感器,同时还对染色质结构及基因表达起重要的调控作用。另外,具有活性的转座子还可用来创制作为功能基因组学研究平台的转座子插入突变体,进一步通过正向或反向遗传学的途径来研究基因的功能。白菜和甘蓝约在4百万年前从它们的共同祖先种分化而来,经过长期的独立进化形成现在约485Mb和630Mb大小的基因组。但是,这两个物种在基因组组成和结构上的差异在本研究之前还不清楚。本文基于全基因组测序和注释的需要,从转座子角度出发,利用已组装的和未组装的全基因组序列以及比较基因组学的途径,分析了白菜、甘蓝以及油菜之间的遗传进化关系,获得了如下研究结果:1.白菜和甘蓝基因组不对称进化利用结构分析和同源比较的方法,我们分别从白菜和甘蓝的组装基因组序列中鉴定到4602和13382个边界清晰的转座子,建立了第一个比较完整的芸薹属转座子数据库。比较分析发现,96.8%的反转座子和93.3%的DNA转座子的扩增或转座发生在白菜和甘蓝物种分化之后。转座子扩增造成的差异解释了白菜和甘蓝基因组大小差异的60%。相对于白菜,甘蓝基因组基因富集区由于转座子的积累发生了较大规模的扩张。分析分布在两个基因组共线性位点的长末端重复反转座子揭示了白菜基因组以更快的碱基替换进化。比较这两个基因组共享的三倍化基因同样揭示白菜比甘蓝具有显著高的同义替换率和显著低的非同义替换率,这些研究结果表明,白菜基因在白菜基因组中受到了更强的纯化选择作用,白菜和甘蓝基因组呈现出不对称进化。这种种间基因组进化上的非对称性可能与共线性区域遗传重组率的差异紧密关联。白菜和甘蓝基因组大小差异一方面是由于转座子的扩增,另一方面白菜比甘蓝受到了更强的非同源重组来去除基因组中的转座子DNA,形成现在相对紧凑的基因组。同时,我们利用这两个基因组中共享的长末端重复反转座子验证了白菜和甘蓝的分化发生在约4.05百万年前。二倍体的白菜A基因组和甘蓝C基因组与异源四倍体油菜中相对应的的A和C基因组分享许多共线性的转座子,但也检测到了高水平的转座子插入位点多态性。对于本文中研究的A、C和AC基因组,白菜的A基因组与油菜的A基因组由于反转座子和DNA转座子造成的差异显著高于甘蓝的C基因组与油菜的C基因组由于转座子造成的差异。甘蓝基因组DNA转座子超家族CACTA的Bocl家族在近期发生了较大规模的扩增,且甘蓝与白菜分化后,它的转座酶基因捕获了3个富含AT的内含子。2.转座子与基因表达调控为了进一步研究转座子对基因表达和功能的影响,我们以拟南芥全基因组中的注释基因序列作为参照,在白菜和甘蓝中鉴定到337个基因含有转座子插入位点,这些基因有68.5%没有被注释或被错误的注释。我们同时利用白菜和甘蓝转录组数据发现转座子以非常低的水平表达,且不同类型的转座子在不同组织中表现出差异性。此外,我们分别在白菜和甘蓝中发现62和148个长末端重复反转座子可能具有转录读出活性,进而影响到侧翼序列(包括基因)的表达。这些转座子的表达可能与DNA甲基化状态有关。3.白菜和甘蓝着丝粒的进化分析白菜和甘蓝基因组不同的染色体形态和组成与着丝粒的进化密切相关。我们利用生物信息学手段,鉴定了在这两个物种着丝粒区域富集的反转座子,并通过荧光原位杂交验证了Gypsy超家族的一个家族Family190特异插入白菜、甘蓝和油菜的着丝粒部位,该家族可能参与了着丝粒的功能。另外,我们鉴定了在A和C基因组着丝粒或近着丝粒区域富集度孑然不同的反转座子家族。

论文目录

  • 摘要
  • Abstract
  • 英文缩略表
  • 第一章 绪论
  • 1.1 芸薹属的分子进化与系统发育
  • 1.1.1 芸薹属多倍体进化
  • 1.1.2 染色体大小和数目变异
  • 1.1.3 基因组共线性
  • 1.1.4 十字花科祖先核型
  • 1.2 植物转座元件研究进展
  • 1.2.1 LTR反转录转座子
  • 1.2.2 LINE和SINE反转录转座子
  • 1.2.3 DNA转座子
  • 1.2.4 自主型和非自主型转座子
  • 1.2.5 转座子与基因表达调控
  • 1.2.6 转座子的应用
  • 1.3 染色体着丝粒的进化
  • 1.3.1 植物着丝粒DNA序列的分子组成
  • 1.3.2 植物着丝粒功能基因
  • 1.3.3 着丝粒的进化
  • 1.3.4 芸薹属着丝粒研究进展
  • 1.4 本研究问题的提出以及研究目的和意义
  • 第二章 白菜和甘蓝基因组不对称进化
  • 2.1 引言
  • 2.2 实验材料
  • 2.3 数据资源与分析方法
  • 2.3.1 数据来源
  • 2.3.2 TE的鉴定及分类
  • 2.3.3 NGS reads估计TE在基因组中的组分
  • 2.3.4 系统发育分析及LTR-RT插入时间的推算
  • 2.3.5 共线性区间的创建
  • 2.3.6 重复基因Ka、Ks和ω(Ka/Ks)的计算
  • 2.3.7 遗传重组率的估计
  • 2.3.8 共享(shared)和非共享(unshared)TE的鉴定
  • 2.4 结果与分析
  • 2.4.1 白菜和甘蓝TE数据库的构建
  • 2.4.2 白菜和甘蓝TE的比较分析-基于组装序列
  • 2.4.3 白菜、甘蓝和油菜TE的比较分析-基于NGS reads的无偏估计
  • 2.4.4 白菜和甘蓝LTR-RT进化时间的差异
  • 2.4.5 甘蓝CACTA元件的近期扩增和转座酶基因内含子的捕获
  • 2.4.6 白菜、甘蓝和油菜共享和非共享TE的比较分析
  • 2.4.7 白菜和甘蓝基因组不对称进化
  • 2.4.8 白菜和甘蓝基因组不同的TE去除速率
  • 2.5 讨论
  • 2.5.1 完整TE数据库的建立是开展下游工作的基础
  • 2.5.2 TE是造成白菜和甘蓝基因组差异的主要因素之一
  • 2.5.3 白菜和甘蓝的不对称进化揭示了遗传重组率的不同
  • 2.5.4 甘蓝CACTA转座酶基因内含子的捕获揭示了有意思的生物学现象
  • 第三章 转座子与基因表达调控
  • 3.1 引言
  • 3.2 实验材料
  • 3.3 数据资源与分析方法
  • 3.3.1 数据来源
  • 3.3.2 含有TE插入位点的基因的鉴定及基因功能分析
  • 3.3.3 转录读出的LTR-RT的确定
  • 3.3.4 TE的表达
  • 3.4 结果与分析
  • 3.4.1 TE插入位点改变基因的结构
  • 3.4.2 LTR-RT的读出带动了邻近序列的转录
  • 3.4.3 TE的低水平表达及组织差异性
  • 3.5 讨论
  • 第四章 白菜和甘蓝着丝粒的进化分析
  • 4.1 引言
  • 4.2 实验材料
  • 4.3 实验方法
  • 4.3.1 白菜、甘蓝和油菜基因组DNA的提取
  • 4.3.2 LTR-RT家族引物及卫星DNA探针的设计
  • 4.3.3 PGR扩增LTR-RT各家族特异序列
  • 4.3.4 荧光原位杂交FISH
  • 4.4 数据资源与分析方法
  • 4.4.1 数据来源
  • 4.4.2 着丝粒富集的LTR-RT的预测
  • 4.4.3 卫星DNA串联重复序列系统进化树的构建
  • 4.5 结果与分析
  • 4.5.1 454序列验证CentBr1和CentBr2
  • 4.5.2 LTR-RT与着丝粒卫星DNA关联分析
  • 4.5.3 白菜比甘蓝具有更大比例的异染色质区
  • 4.5.4 FISH验证着丝粒关联的LTR-RT家族
  • 4.6 讨论
  • 第五章 全文结论
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    两个芸薹属二倍体物种及其异源四倍体转座元件的鉴定、比较和进化分析
    下载Doc文档

    猜你喜欢