论文摘要
二倍体的白菜、甘蓝以及它们的异源四倍体甘蓝型油菜是我国重要的蔬菜和油料作物,它们之间遗传关系是我们研究芸薹属进化的基础。转座元件或转座子是大多数真核生物基因组的主要组成成分。除了多倍体化外,转座子的大规模扩增是造成植物基因组快速膨胀的主要因素。转座子不仅仅是基因组进化的传感器,同时还对染色质结构及基因表达起重要的调控作用。另外,具有活性的转座子还可用来创制作为功能基因组学研究平台的转座子插入突变体,进一步通过正向或反向遗传学的途径来研究基因的功能。白菜和甘蓝约在4百万年前从它们的共同祖先种分化而来,经过长期的独立进化形成现在约485Mb和630Mb大小的基因组。但是,这两个物种在基因组组成和结构上的差异在本研究之前还不清楚。本文基于全基因组测序和注释的需要,从转座子角度出发,利用已组装的和未组装的全基因组序列以及比较基因组学的途径,分析了白菜、甘蓝以及油菜之间的遗传进化关系,获得了如下研究结果:1.白菜和甘蓝基因组不对称进化利用结构分析和同源比较的方法,我们分别从白菜和甘蓝的组装基因组序列中鉴定到4602和13382个边界清晰的转座子,建立了第一个比较完整的芸薹属转座子数据库。比较分析发现,96.8%的反转座子和93.3%的DNA转座子的扩增或转座发生在白菜和甘蓝物种分化之后。转座子扩增造成的差异解释了白菜和甘蓝基因组大小差异的60%。相对于白菜,甘蓝基因组基因富集区由于转座子的积累发生了较大规模的扩张。分析分布在两个基因组共线性位点的长末端重复反转座子揭示了白菜基因组以更快的碱基替换进化。比较这两个基因组共享的三倍化基因同样揭示白菜比甘蓝具有显著高的同义替换率和显著低的非同义替换率,这些研究结果表明,白菜基因在白菜基因组中受到了更强的纯化选择作用,白菜和甘蓝基因组呈现出不对称进化。这种种间基因组进化上的非对称性可能与共线性区域遗传重组率的差异紧密关联。白菜和甘蓝基因组大小差异一方面是由于转座子的扩增,另一方面白菜比甘蓝受到了更强的非同源重组来去除基因组中的转座子DNA,形成现在相对紧凑的基因组。同时,我们利用这两个基因组中共享的长末端重复反转座子验证了白菜和甘蓝的分化发生在约4.05百万年前。二倍体的白菜A基因组和甘蓝C基因组与异源四倍体油菜中相对应的的A和C基因组分享许多共线性的转座子,但也检测到了高水平的转座子插入位点多态性。对于本文中研究的A、C和AC基因组,白菜的A基因组与油菜的A基因组由于反转座子和DNA转座子造成的差异显著高于甘蓝的C基因组与油菜的C基因组由于转座子造成的差异。甘蓝基因组DNA转座子超家族CACTA的Bocl家族在近期发生了较大规模的扩增,且甘蓝与白菜分化后,它的转座酶基因捕获了3个富含AT的内含子。2.转座子与基因表达调控为了进一步研究转座子对基因表达和功能的影响,我们以拟南芥全基因组中的注释基因序列作为参照,在白菜和甘蓝中鉴定到337个基因含有转座子插入位点,这些基因有68.5%没有被注释或被错误的注释。我们同时利用白菜和甘蓝转录组数据发现转座子以非常低的水平表达,且不同类型的转座子在不同组织中表现出差异性。此外,我们分别在白菜和甘蓝中发现62和148个长末端重复反转座子可能具有转录读出活性,进而影响到侧翼序列(包括基因)的表达。这些转座子的表达可能与DNA甲基化状态有关。3.白菜和甘蓝着丝粒的进化分析白菜和甘蓝基因组不同的染色体形态和组成与着丝粒的进化密切相关。我们利用生物信息学手段,鉴定了在这两个物种着丝粒区域富集的反转座子,并通过荧光原位杂交验证了Gypsy超家族的一个家族Family190特异插入白菜、甘蓝和油菜的着丝粒部位,该家族可能参与了着丝粒的功能。另外,我们鉴定了在A和C基因组着丝粒或近着丝粒区域富集度孑然不同的反转座子家族。
论文目录
相关论文文献
标签:芸薹属论文; 转座元件论文; 不对称进化论文; 共线性论文; 转录组论文; 着丝粒论文; 进化论文; 比较基因组学论文;