基于生物信息学方法的水稻TLP、SBP-box、CPP-like、Cystatin和HAK基因家族的分子进化研究

基于生物信息学方法的水稻TLP、SBP-box、CPP-like、Cystatin和HAK基因家族的分子进化研究

论文摘要

基因家族起源、分化的分子机制研究是生物进化领域的重要研究内容。随着各种模式生物基因组测序工作的完成,人们对基因家族研究兴趣越来越浓。植物基因组中基因家族的成员数目往往比动物等其他物种中更多,这主要是由于其在植物物种中特异性扩张造成的,物种特异性扩张主要有3种方式,即片段复制、串联重复和逆转录转座等。其中片段重复和串联重复为主要方式。重复的基因可能经历正选择和基因转换等适应性进化的选择压力。目前对重复基因的命运的讨论已比较多,主要模型有亚功能化、非功能化、新功能化和亚新功能化等模型。水稻基因组在进化过程中至少经历了两次全基因组倍增事件,从而产生了大量的重复基因。已有生物信息学分析表明水稻籼粳两个亚种的分化时间可能在距今50万年前。此外,在水稻基因组被测序之后,多个研究机构对水稻中基因家族的分子进化规律进行了分析,使得基因家族的分子进化研究成为水稻基因组研究领域的热点之一。本文在这些研究的基础上,从基因组水平上对水稻TLP、SBP-box、CPP-like、Cystatin和HAK 5个基因家族进行了生物信息学分析和分子进化研究。主要结果如下:(1)类Tubby蛋白质(Tubby-like proteins,TLP)在动物中属于一个较小的蛋白质家族,但是在动物生长发育中起着重要作用,主要表现在对神经细胞的维持和功能等方面。该基因家族的成员广泛存在于动植物等多细胞生物中。本研究中,对拟南芥、水稻和杨树的TLP基因家族进行了系统发生分析,并进行了分子进化研究。通过在基因组水平上的搜索,在拟南芥、水稻和杨树基因组中分别发现了11、14和11个TLP基因。植物中的大部分TLP蛋白质包含两个高度保守的结构域,分别是TUB和F-box结构域。通过系统发生分析,可以将植物中的该基因家族成员分成3个亚族,并且发现该基因家族成员数目在单子叶和双子叶植物分离之后按照物种特异性的方式进行了扩张。该基因家族的内含子位置在大多数基因中是保守的,表明这一基因家族的外显子/内含子结构在单子叶和双子叶植物分离之前便已经形成了。在基因组水平上对这3个物种的基因扩张模式进行了分析,发现水稻和杨树TLP基因家族的扩张主要是由于片段重复引起的,而非串联重复和随机性复制与重复事件。协同进化分析表明TUB和F-box结构域在进化过程中是协同进化的,并且可能一起行使着一定的功能。对3个物种中TLP的旁系同源基因进行的组织特异性表达分析表明在长期的进化过程中,重复基因发生功能分歧是其主要特征。对重复基因的Ka /Ks分析表明正选择和自然选择可能对重复基因的功能性分歧起着重要作用。(2)SBP-box基因家族是植物特有的转录因子基因家族。这类基因编码的蛋白质序列中包含一个高度保守的SBP结构域,并能够特异结合在植物花分生组织识别基因SQUAMOSA及其同源基因的启动子区段,以调控其表达。本研究中,利用已知SBP-box基因所编码蛋白质的SBP结构域为检索序列,在拟南芥和水稻基因组中分别鉴定出17和19个SBP-box基因。系统发生分析表明这类基因的基本特点在拟南芥和水稻分离之前便已经建立,并且在单子叶和双子叶植物分离之后,在拟南芥和水稻中均按照物种特异性的方式进行了扩张,片段复制对这两个物种中SBP-box基因家族的扩张均起到重要的作用。根据系统发生树将SBP-box基因家族分成了9个同源簇,每一同源簇中均具有相似的基序,并且基序在蛋白质中的排列顺序也非常相似。非同义替换率与同义替换率分析表明同源基因的SBP结构域区段经历了纯化选择,而结构域之外的区段则经历了正选择或者较弱的纯化选择。通过对EST数据库的搜索,进一步分析了SBP-box基因家族的表达模式,结果表明拟南芥的SBP-box基因主要在花、叶、根和种子中表达,而水稻的SBP-box基因则主要在花和愈伤组织中表达。(3)类CPP基因家族(CPP-like gene family)属于一类成员数目较少的基因家族,该基因家族成员编码的蛋白质序列含有一到两个富含半胱氨酸的结构域,即CXC结构域。该基因家族在植物和动物中广泛存在,但是没有在酵母中发现。为了解CPP-like基因家族在植物中的进化规律,本研究对拟南芥和水稻基因组中的CPP-like基因家族进行了比较分析和分子进化研究。系统进化分析表明在单子叶和双子叶植物分化完成之后,拟南芥和水稻基因组中的CPP-like基因家族按照物种特异性的方式进行了扩张,并且在拟南芥中还发现了基因丢失现象。对重复基因的内含子/外显子结构分析表明内含子获得和丢失均对这些基因的进化起到重要的作用。进一步分析表明正选择压力是植物中CPP-like基因进化的主要动力,并且发现具有正选择作用的氨基酸位点大部分位于结构域之外的序列中。此外本研究还发现CPP-like基因编码的蛋白质中存在两段CXC结构域,这两段CXC结构域序列及连接这两段结构域的序列在长期的进化过程中是协同进化的。(4)半胱氨酸蛋白酶抑制剂(cystatin)基因广泛存在于植物物种中。该类基因能够起到抑制某些病原微生物和昆虫体内半胱氨酸蛋白酶的作用,在植物的防卫体系中起到重要作用。我们利用已经分离出的植物cystatin基因的cystatin结构域为检索序列在基因组水平上对拟南芥和水稻中的cystatin基因家族的成员进行了鉴定和系统发生分析。结合结构域的鉴定、多序列联配以及MEME分析最终确定了7个拟南芥和12个水稻的cystatin基因。系统发生分析表明cystatin基因的基本特征很可能是在拟南芥和水稻的分离之前就已经形成了。cystatin结构域在蛋白质间是高度保守的。拟南芥与水稻Cystatin基因家族的两个亚族之间发生了功能性分歧,并且适应性进化在其进化过程中起着重要作用。拟南芥和水稻的cystatin基因主要在花、叶、根、种子和愈伤组织中表达,这对植物避免昆虫的侵害将起到重要作用。(5)高亲和力钾离子(high-affinity K+)转运体基因家族是植物中最大的钾离子转运基因家族,在植物的生长发育中起着重要作用。本研究中通过全基因组搜索,在水稻基因组中发现27个编码高亲和力钾离子转运体的基因。通过系统发生树将拟南芥与水稻的HAK转运子基因家族分成4个相互独立的亚族。在单子叶和双子叶植物分离之后,水稻中的HAK基因按照种系特异性方式进行了扩张。对该基因家族的功能性分歧分析表明该家族发生了功能性分歧现象。对该基因家族的适应性进化分析表明具有正选择效应的点突变和基因转换事件在该基因家族的进化过程中起到重要的作用。以上关于水稻5个基因家族的生物信息学分析和分子进化研究结果将为这些基因的功能鉴定奠定重要基础。

论文目录

  • 缩略词表
  • 中文摘要
  • Abstract
  • 第1章 植物基因家族分子进化机制及水稻基因组进化的研究进展
  • 1.1 基因家族的物种特异性扩张及其扩张模式
  • 1.1.1 大片段复制
  • 1.1.2 串联重复
  • 1.1.3 逆转录转座
  • 1.2 适应性进化
  • 1.2.1 正选择压力与适应性进化
  • 1.2.2 基因转换
  • 1.3 基因家族成员的功能分歧及重复基因的命运
  • 1.4 植物基因家族分子进化的特点
  • 1.4.1 分子进化速率的相对恒定
  • 1.4.2 基因家族分子进化的“保守性”
  • 1.5 水稻基因组进化的研究进展
  • 1.5.1 水稻基因组的古多倍体化过程
  • 1.5.2 水稻籼粳两个亚种的分化
  • 1.5.3 水稻驯化相关基因的进化研究
  • 1.5.4 水稻基因家族的分子进化研究
  • 参考文献
  • 第2章 拟南芥、水稻和杨树类Tubby 基因家族的分子进化研究
  • 2.1 材料和方法
  • 2.1.1 数据库搜索
  • 2.1.2 序列分析
  • 2.1.3 协同进化分析
  • 2.1.4 TLP 基因的扩张模式分析
  • 2.1.5 Ka 和Ks 的计算及重复事件发生时间的估计
  • 2.1.6 TLP 基因的表达模式分析
  • 2.1.6.1 水稻TLP 基因的RT-PCR 分析
  • 2.1.6.1.1 植物材料来源
  • 2.1.6.1.2 植物组织提取RNA
  • 2.1.6.1.3 引物设计
  • 2.1.6.1.4 反转录和PCR
  • 2.1.6.2 基于MPSS 的拟南芥和水稻TLP 基因的表达分析
  • 2.1.6.3 基于EST 的杨树TLP 基因的表达分析
  • 2.2 结果
  • 2.2.1 拟南芥、水稻和杨树的TLP 基因
  • 2.2.2 拟南芥、水稻和杨树中TLP 家族的系统发生分析
  • 2.2.3 多序列联配
  • 2.2.4 拟南芥、水稻和杨树TLP 基因中内含子的分布
  • 2.2.5 F-box 和TUB 结构域的协同进化分析
  • 2.2.6 拟南芥、水稻和杨树基因组中TLP 基因的扩张模式
  • 2.2.7 片段重复事件发生的时间
  • 2.2.8 拟南芥、水稻和杨树TLP 基因的表达模式
  • 2.2.9 基因复制后的环境选择压力
  • 2.3 讨论
  • 参考文献
  • 第3章 拟南芥与水稻SBP-box 基因家族的比较分析
  • 3.1 材料和方法
  • 3.1.1 拟南芥和水稻基因组中SBP-box 基因的鉴定
  • 3.1.2 序列分析
  • 3.1.3 Ka 和Ks 的计算
  • 3.1.4 基于EST 的表达分析
  • 3.1.5 SBP-box 基因扩张模式分析
  • 3.2 结果
  • 3.2.1 拟南芥和水稻基因组中SBP-box 基因
  • 3.2.2 拟南芥与水稻SBP-box 家族的系统发生分析
  • 3.2.3 拟南芥与水稻SBP-box 基因家族扩张的模式
  • 3.2.4 SBP-box 蛋白质中的保守性序列
  • 3.2.5 基因重复后的环境选择压力
  • 3.2.6 基于EST 的表达分析
  • 3.3 讨论
  • 参考文献
  • 第4章 拟南芥与水稻类CPP 基因家族的分子进化研究
  • 4.1 材料和方法
  • 4.1.1 序列搜索
  • 4.1.2 多序列联配和系统发生树的构建
  • 4.1.3 基因扩张模式的分析
  • 4.1.4 正选择作用分析
  • 4.1.5 结构域的协同进化分析
  • 4.2 结果
  • 4.2.1 拟南芥与水稻基因组中的CPP-like 基因
  • 4.2.2 多序列联配
  • 4.2.3 系统发生分析
  • 4.2.4 拟南芥与水稻CPP-like 基因的扩张模式
  • 4.2.5 正选择位点的检验
  • 4.2.6 两段CXC 结构域序列的协同进化分析
  • 4.3 讨论
  • 参考文献
  • 第5章 拟南芥和水稻Cystatin 基因家族的生物信息学分析
  • 5.1 材料和方法
  • 5.1.1 数据库的搜索
  • 5.1.2 序列分析
  • 5.1.3 亚族间的功能性分歧分析
  • 5.1.4 适应性进化分析
  • 5.1.5 基于EST 的基因表达分析
  • 5.2 结果与分析
  • 5.2.1 水稻和拟南芥中的 cystatin 基因
  • 5.2.2 水稻和拟南芥的 cystatin 基因结构及在染色体上的位置
  • 5.2.3 系统发生分析
  • 5.2.4 拟南芥和水稻中 cystatin 蛋白的保守序列分析
  • 5.2.5 亚族之间的功能性分歧
  • 5.2.6 拟南芥与水稻Cystatin 基因家族的适应性进化分析
  • 5.2.7 拟南芥和水稻中Cystatin 基因家族的EST 表达分析
  • 5.3 讨论
  • 参考文献
  • 第6章 水稻高亲和力钾离子(HAK)转运体基因家族的种系特异性扩张和适应性进化研究
  • 6.1 材料和方法
  • 6.1.1 基因组水平上水稻HAK 转运体基因的鉴定
  • 6.1.2 序列分析
  • 6.1.3 水稻HAK 基因的扩张模式分析
  • 6.2 结果
  • 6.2.1 水稻中的HAK 钾离子转运体基因
  • 6.2.2 水稻 HAK 钾离子转运体基因的系统发生分析和种系特异性扩张
  • 6.2.3 HAK 基因亚族之间的功能性分歧
  • 6.2.4 正选择位点和基因转换事件的检验
  • 6.3 讨论
  • 参考文献
  • 攻读博士学位期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    基于生物信息学方法的水稻TLP、SBP-box、CPP-like、Cystatin和HAK基因家族的分子进化研究
    下载Doc文档

    猜你喜欢