论文摘要
基因家族起源、分化的分子机制研究是生物进化领域的重要研究内容。随着各种模式生物基因组测序工作的完成,人们对基因家族研究兴趣越来越浓。植物基因组中基因家族的成员数目往往比动物等其他物种中更多,这主要是由于其在植物物种中特异性扩张造成的,物种特异性扩张主要有3种方式,即片段复制、串联重复和逆转录转座等。其中片段重复和串联重复为主要方式。重复的基因可能经历正选择和基因转换等适应性进化的选择压力。目前对重复基因的命运的讨论已比较多,主要模型有亚功能化、非功能化、新功能化和亚新功能化等模型。水稻基因组在进化过程中至少经历了两次全基因组倍增事件,从而产生了大量的重复基因。已有生物信息学分析表明水稻籼粳两个亚种的分化时间可能在距今50万年前。此外,在水稻基因组被测序之后,多个研究机构对水稻中基因家族的分子进化规律进行了分析,使得基因家族的分子进化研究成为水稻基因组研究领域的热点之一。本文在这些研究的基础上,从基因组水平上对水稻TLP、SBP-box、CPP-like、Cystatin和HAK 5个基因家族进行了生物信息学分析和分子进化研究。主要结果如下:(1)类Tubby蛋白质(Tubby-like proteins,TLP)在动物中属于一个较小的蛋白质家族,但是在动物生长发育中起着重要作用,主要表现在对神经细胞的维持和功能等方面。该基因家族的成员广泛存在于动植物等多细胞生物中。本研究中,对拟南芥、水稻和杨树的TLP基因家族进行了系统发生分析,并进行了分子进化研究。通过在基因组水平上的搜索,在拟南芥、水稻和杨树基因组中分别发现了11、14和11个TLP基因。植物中的大部分TLP蛋白质包含两个高度保守的结构域,分别是TUB和F-box结构域。通过系统发生分析,可以将植物中的该基因家族成员分成3个亚族,并且发现该基因家族成员数目在单子叶和双子叶植物分离之后按照物种特异性的方式进行了扩张。该基因家族的内含子位置在大多数基因中是保守的,表明这一基因家族的外显子/内含子结构在单子叶和双子叶植物分离之前便已经形成了。在基因组水平上对这3个物种的基因扩张模式进行了分析,发现水稻和杨树TLP基因家族的扩张主要是由于片段重复引起的,而非串联重复和随机性复制与重复事件。协同进化分析表明TUB和F-box结构域在进化过程中是协同进化的,并且可能一起行使着一定的功能。对3个物种中TLP的旁系同源基因进行的组织特异性表达分析表明在长期的进化过程中,重复基因发生功能分歧是其主要特征。对重复基因的Ka /Ks分析表明正选择和自然选择可能对重复基因的功能性分歧起着重要作用。(2)SBP-box基因家族是植物特有的转录因子基因家族。这类基因编码的蛋白质序列中包含一个高度保守的SBP结构域,并能够特异结合在植物花分生组织识别基因SQUAMOSA及其同源基因的启动子区段,以调控其表达。本研究中,利用已知SBP-box基因所编码蛋白质的SBP结构域为检索序列,在拟南芥和水稻基因组中分别鉴定出17和19个SBP-box基因。系统发生分析表明这类基因的基本特点在拟南芥和水稻分离之前便已经建立,并且在单子叶和双子叶植物分离之后,在拟南芥和水稻中均按照物种特异性的方式进行了扩张,片段复制对这两个物种中SBP-box基因家族的扩张均起到重要的作用。根据系统发生树将SBP-box基因家族分成了9个同源簇,每一同源簇中均具有相似的基序,并且基序在蛋白质中的排列顺序也非常相似。非同义替换率与同义替换率分析表明同源基因的SBP结构域区段经历了纯化选择,而结构域之外的区段则经历了正选择或者较弱的纯化选择。通过对EST数据库的搜索,进一步分析了SBP-box基因家族的表达模式,结果表明拟南芥的SBP-box基因主要在花、叶、根和种子中表达,而水稻的SBP-box基因则主要在花和愈伤组织中表达。(3)类CPP基因家族(CPP-like gene family)属于一类成员数目较少的基因家族,该基因家族成员编码的蛋白质序列含有一到两个富含半胱氨酸的结构域,即CXC结构域。该基因家族在植物和动物中广泛存在,但是没有在酵母中发现。为了解CPP-like基因家族在植物中的进化规律,本研究对拟南芥和水稻基因组中的CPP-like基因家族进行了比较分析和分子进化研究。系统进化分析表明在单子叶和双子叶植物分化完成之后,拟南芥和水稻基因组中的CPP-like基因家族按照物种特异性的方式进行了扩张,并且在拟南芥中还发现了基因丢失现象。对重复基因的内含子/外显子结构分析表明内含子获得和丢失均对这些基因的进化起到重要的作用。进一步分析表明正选择压力是植物中CPP-like基因进化的主要动力,并且发现具有正选择作用的氨基酸位点大部分位于结构域之外的序列中。此外本研究还发现CPP-like基因编码的蛋白质中存在两段CXC结构域,这两段CXC结构域序列及连接这两段结构域的序列在长期的进化过程中是协同进化的。(4)半胱氨酸蛋白酶抑制剂(cystatin)基因广泛存在于植物物种中。该类基因能够起到抑制某些病原微生物和昆虫体内半胱氨酸蛋白酶的作用,在植物的防卫体系中起到重要作用。我们利用已经分离出的植物cystatin基因的cystatin结构域为检索序列在基因组水平上对拟南芥和水稻中的cystatin基因家族的成员进行了鉴定和系统发生分析。结合结构域的鉴定、多序列联配以及MEME分析最终确定了7个拟南芥和12个水稻的cystatin基因。系统发生分析表明cystatin基因的基本特征很可能是在拟南芥和水稻的分离之前就已经形成了。cystatin结构域在蛋白质间是高度保守的。拟南芥与水稻Cystatin基因家族的两个亚族之间发生了功能性分歧,并且适应性进化在其进化过程中起着重要作用。拟南芥和水稻的cystatin基因主要在花、叶、根、种子和愈伤组织中表达,这对植物避免昆虫的侵害将起到重要作用。(5)高亲和力钾离子(high-affinity K+)转运体基因家族是植物中最大的钾离子转运基因家族,在植物的生长发育中起着重要作用。本研究中通过全基因组搜索,在水稻基因组中发现27个编码高亲和力钾离子转运体的基因。通过系统发生树将拟南芥与水稻的HAK转运子基因家族分成4个相互独立的亚族。在单子叶和双子叶植物分离之后,水稻中的HAK基因按照种系特异性方式进行了扩张。对该基因家族的功能性分歧分析表明该家族发生了功能性分歧现象。对该基因家族的适应性进化分析表明具有正选择效应的点突变和基因转换事件在该基因家族的进化过程中起到重要的作用。以上关于水稻5个基因家族的生物信息学分析和分子进化研究结果将为这些基因的功能鉴定奠定重要基础。
论文目录
相关论文文献
标签:水稻论文; 基因家族论文; 分子进化论文; 物种特异性扩张论文; 适应性进化论文; 功能性分歧论文; 片段重复论文; 串联重复论文; 正选择论文; 协同进化论文;