水稻基因组的进化选择模式研究

水稻基因组的进化选择模式研究

论文摘要

达尔文认为自然选择是进化的主要驱动力,但他的理论提出后,随后遭受到中性理论者的反对。早期的分子研究结果发现,蛋白质中的氨基酸的替换大多数是中性的,只有一些关键的氨基酸改变才能导致蛋白质功能的变化,这个现象的解释引起了中性进化和选择理论的激烈争论。本研究中针对水稻基因组中特殊的三类DNA序列类型进行了分子进化研究,结果表明自然选择在水稻基因组上普遍存在,是水稻基因组演化的主要驱动力之一。具体研究结果如下:1)miRNA目标(靶)基因的结合位点microRNA(miRNA)是在转录后通过与目标mRNA结合来抑制基因的表达。了解miRNA结合位点的进化模式将有助于理miRNA和它们目标序列的协同进化趋势。为了研究植物中的以上情况,我们基于以下两组数据展开了调查研究:(1)全基因组倍增基因中受到miRNA调控的基因数据;(2)6个受miRNA调控基因的群体遗传学数据。利用生物信息学预测方法,在1331个来自全基因组倍增事件的基因对中,105个基因对存在已知miRNA的结合位点。序列替代分析表明miRNA结合位点区域的同义替代率显著性低于其相邻的5’端和3’端区域。在105个倍增基因对中,大多数倍增基因对(86对)中只有一个同源基因存在mLRNA目标结合位点。这一结果可能是由于基因对在全基因组倍增之后其中一个同源基因获得了miRNA结合位点或者是其中一个同源基因在全基因组倍增之后丢失了miRNA结合位点。估计miRNA的目标结合位点的获得/丢失率为每年5.2×10-9个,同时大多数获得/丢失(83.8%)是由于核苷酸突变造成的。6个miRNA结合位点区域的栽培稻(30个样本)和野生稻(15个样本)群体数据分析表明,miRNA结合区域没有观察到分离位点,然而其两端连接区域在栽培稻和野生稻群体中分别检测到每21个碱基存在0.12(栽培群体)和0.20(野生群体)个分离位点,平均核苷酸分歧度(π)分别为0.00153(栽培群体)和0.00180(野生群体)。以上比较基因组学和群体遗传学分析结果都支持miRNA结合位点受到明显的净化选择压的观点,即通过消除有害突变位点来维持其结合位点的保守性,同时,研究还表明核苷酸突变在获得/丢失miRNA结合位点进化过程中扮演着重要角色。2)非编码基因序列基因组内存在大量的非蛋白编码DNA序列,以往的普遍认识是这些序列为无功能的序列。然而随着基因组研究的深入,已发现这些非编码DNA序列(例如内含子序列)并非没有功能。一些研究已观察到人和动物内含子的选择性限制和它们的长度、G+C含量和基因内位置的关联性。然而在植物中还未开展类似研究。对于非编码DNA选择性限制分析,一般会利用相近物种间的比较和比较的物种存在相似选择压的假设。利用相近物种可以使非编码区序列不会因序列分歧过大而难于获得准确的序列联配结果。我们利用来自水稻距今约700万年前的一次片段倍增基因数据(其中包括605对同源内含子),考察了内含子的选择性限制。主要结果为:(1)同源内含子的分歧度和内含子的长度呈负相关性,这种进化模式和果蝇以及哺乳类动物中的研究结果相一致;(2)剪接位点区域存在很强的净化选择信号;(3)第一位内含子显著地长于其他内含子,并且G+C含量也显著地高于其他内含子;(4)第一位内含子和其他内含子在分歧程度上没有显著差异,这种模式不同于果蝇和哺乳类动物的报道;(5)内含子比四重简并位点分歧程度要高,这表明四重简并位点上受到选择压的作用。我们的研究结果还表明,在较长的内含子上观察到了更强烈选择压,这表说功能因子可能更多地富集于长内含子中,因为功能因子通常受到强烈的净化选择作用,该结果和在剪接位点上观察到强烈的净化选择作用是一致的。和其他物种的研究结果一样,选择性限制在第一位内含子上没有表现出更强的选择性限制。3)高G+C含量基因水稻和其它禾本科基因组内存在两类基因,一类是富含G+C的(所谓高G+C含量基因),另一类是贫乏G+C的(所谓低G+C含量基因)。这两类基因仅被证实存在于单子叶,在双子叶不存在高G+C含量基因。人们一直来试图了解什么进化机制导致水稻等基因组中两类编码区G+C碱基组成的变异。通常基于估算转录方向的G+C含量以及同义位点和非同义位点替代率的方法,来考察是否是突变偏好或自然选择作为水稻G+C含量进化的变异机制。通过分析水稻高低G+C含量的同源基因,我们发现:(1)四重简并位点G+C含量明显高于内含子;(2)利用拟南芥基因组中直系同源基因作为参照来比较水稻高低G+C含量的同源基因,结果表明水稻这两类同源基因在2重和4重简并位点上以T→C替换模式为主,而A→C和A→G替换模式主要发生在0重简并位点上;(3)有效密码子数目(Nc)和密码子适应指数(CAI)表明高G+C含量基因具有更大的密码子偏好性,并且这种偏好易发生于那些高表达基因中。以上结果表明,在水稻高G+C含量基因存在明显的密码子选择压。另外,禾本科作物玉米也表现出与水稻同样的密码子使用偏好性趋势。综上所述,在水稻和其他禾本科作物中,至少部分高G+C含量基因是由于对其密码子使用的选择偏好导致G+C含量的显著增加。

论文目录

  • 致谢
  • 图一览表
  • 表一览表
  • 摘要
  • Abstract
  • 第一章 文献综述
  • 1.1 水稻基因组
  • 1.2 基因组倍增
  • 1.2.1 全基因组倍增
  • 1.2.2 局部基因组倍增
  • 1.3 DNA序列水平上的进化
  • 1.3.1 中性理论
  • 1.3.2 同义替代和非同义替代
  • 1.3.3 碱基组成的进化机制
  • 1.3.4 非编码区的选择性限制
  • 1.4 非编码区序列miRNA
  • 1.5 论文组织
  • 第二章 水稻miRNA结合位点的进化模式
  • 2.1 前言
  • 2.2 材料和方法
  • 2.2.1 实验材料
  • 2.2.2 PCR和DNA测序
  • 2.2.3 基因组倍增基因的定义
  • 2.2.4 miRNA靶基因结合位点的预测
  • 2.2.5 序列替换、分化和系统进化分析
  • 2.3 结果与讨论
  • 2.3.1 全基因组倍增基因中miRNA靶基因的预测
  • 2.3.2 miRNA结合位点的序列替代率
  • 2.3.3 miRNA结合位点的核苷酸分歧度
  • 2.3.4 miRNA结合位点的捕获和丢失
  • 2.4 附件材料
  • 第三章 水稻非编码DNA序列的进化模式
  • 3.1 前言
  • 3.2 材料和方法
  • 3.2.1 来自片段倍增基因的鉴定
  • 3.2.2 同源内含子的鉴定和联配
  • 3.2.3 分歧度的估算和选择性限制的计算
  • 3.3 结果与讨论
  • 3.3.1 内含子数据
  • 3.3.2 内含子长度
  • 3.3.3 内含子顺序和位置
  • 3.3.4 剪接位点
  • 3.3.5 G+C碱基组成含量
  • 3.3.6 替代模式
  • 3.4 结论
  • 第四章 水稻编码区内G+C含量的进化动力
  • 4.1 前言
  • 4.2 材料和方法
  • 4.2.1 数据源
  • 4.2.2 同源基因的定义
  • 4.2.3 密码子的使用和统计分析
  • 4.3 结果
  • 4.3.1 结构差异
  • 4.3.2 密码子使用偏好
  • 4.3.3 密码子使用的选择动力
  • 4.3.4 基因表达水平
  • 4.4 讨论
  • 4.5 附件材料
  • 参考文献
  • 发表论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    水稻基因组的进化选择模式研究
    下载Doc文档

    猜你喜欢