论文摘要
甘蓝型油菜(Brassica napus L.)是世界上种植最广泛的油料作物之一,在我国农业生产中也占有重要地位,传统的甘监型黑籽油菜具有抗病虫、抗倒伏、油菜籽产量高等优点。但其籽粒的含油量偏低,芥酸、硫代葡萄糖甙、多酚类物质以及色素等含量偏高。榨出的油色泽深,烹调时油烟多,而且芥酸不易被人体消化吸收,营养价值低,饼粕中的硫代葡萄糖甙的水解产物对牲畜有毒。因此,提高甘监型油菜籽粒的含油量,降低菜油中的芥酸、硫代葡萄糖甙、多酚类物质以及色素等的含量,改善菜籽油的品质,是油菜育种的重要目标。甘蓝型黄籽油菜与黑籽相比,具有种皮薄、色素和纤维素含量低、饼粕中蛋白质含量高、在相同的遗传背景下含油量高等优点。黄籽性状具有综合品质优势和良好的市场前景,但黄籽油菜遗传不稳定,是亟待解决的问题,而通过远缘杂交等方法创造黄籽材料的选育周期长、效率低,尤其是黄籽表型易受环境影响而不稳定。当前急需对甘监型油菜及其亲本物种中与黄籽性状相关的重要功能基因进行全长序列的克隆,并通过比较基因组学研究,揭示这3个物种间在黄籽性状上的分子遗传学机理,为通过基因工程改良甘蓝型油菜的粒色性状提供理论依据。异源四倍体物种甘监型油菜由二倍体物种白菜(B.rapa)和甘蓝(B.oleracea)融合而成。芸薹属与拟南芥(Arabidopsis thaliana)之间、芸薹属内种间特别是禹氏三角物种间的比较基因组学研究,对于揭示十字花科等植物的物种形成、基因进化、重要性状的演化规律等具有重要价值,但该领域中基于功能基因的比较基因组学研究还很少。类黄酮化合物是广泛存在的植物次生代谢物,它是植物组织中红色、蓝色和紫色花青素色素的呈色物质。拟南芥等植物中种皮色素的主要成分是原花青素单体的聚合物,是由公共苯丙烷-类黄酮-原花青素途径而合成的。该途径的众多基因中,TTG1基因是WD40家族成员中的一员,是一种重要的转录因子。拟南芥ttg1突变体中,种皮不能形成花青素,外种皮表现为透明的性状。多种植物研究表明,TTG1基因在花青素合成途径中起着重要的调控作用。TT18基因一般称为花色素合成酶(anthocyanidin synthase)基因也有叫无色花色素双加氧酶(Leucoanthocyanidin dioxygenase)基因,是位于花色素苷生物合成途径中倒数第二步的一个关键酶,催化无色的原花色素(leucoanthocyanidins)氧化成有色的花色素(anthocyanidin),对植物的色素形成至关重要。拟南芥tt18突变体的种子都是黄褐色的。拟南芥等多种植物研究表明,TT18基因是花青素合成途径中的重要结构基因。本研究克隆了甘蓝型油菜、甘蓝、白菜TTG1和TT18基因家族的全长序列,对序列进行了系统的生物信息学分析和功能比较基因组学分析,对3个物种的黑、黄籽材料间TTG1、TT18表达差异进行了研究。主要结果如下:1)甘蓝型油菜、甘蓝、白菜TTG1基因家族的全长序列的克隆采用RACE技术,克隆了甘蓝型油菜、甘蓝、白菜TTG1基因家族各2个成员的全长cDNA和对应的全长基因组序列。甘蓝型油菜BnTTG1-1、BnTTG1-2的全长基因组序列分别为1511bp、1555bp,典型的全长mRNA[不计Ploy(A)尾巴,下同]分别为1355bp和1303bp。甘蓝BoTTG-2的全长基因组序列为1594bp,BoTTG1-1、BoTTG1-2的典型全长mRNA分别为1355bD和1404bp。白菜BrTTG1-1、BrTTG1-2的全长基因组序列分别为1656bp、1541bp,它们典型的全长mRNA分别为1478bp和1364bp。芸薹属3个物种TTG1基因家族成员大部分均具有一个1014bp的开放读码框(ORF,含终止密码子),5’UTR长度介于53-169bp,3’UTR长度介于162~617bp。这是在芸薹属植物首次全面系统克隆TTG1基因,为深入研究TTG1基因的功能、进化、调控模式奠定了基础,也为通过操作TTG1基因来改良芸薹属物种的籽色、表皮毛、根毛、种皮粘液等性状奠定了基础。2)甘蓝型油菜及其亲本物种TTG1家族的蛋白结构特征推导的BnTTG1-1、BnTTG1-2、BoTTG1-1、BoTTG1-2、BrTTG1-1、BrTTG1-2蛋白均为337个氨基酸残基,分子量(Mw)分别为37.28、37.26、37.27、37.31、37.28和37.20kD,等电点(pI)均为4.66,都为酸性蛋白。它们均以丝氨酸最丰富,酸性氨基酸多于碱性氨基酸。用NetPhos 2.0预测它们都存在较多的潜在磷酸化位点,BnTTG1-1、BoTTG1-1和BrTTG1-1都有26个,BnTTG1-2和BrTTG1-2均有25个,BoTTG1-2有27个。所以磷酸化可能参与它们的蛋白活性调节。均没有预测到它们存在信号肽和跨膜域,预测它们均可能定位于细胞质内。用SOPMA对芸薹属TTG1家族蛋白二级结构进行预测表明,各TTG1蛋白成员的二级结构非常相似,主要由延伸链(Extended strand)和随机卷曲(Random coil)构成,其中随机卷曲所占比例最高,β转角(Beta turn)不足10%,α螺旋很少。芸薹属TTG1蛋白和AtTTG1蛋白二级结构很相似,整个分子分布大量的随机卷曲。未能预测出这些蛋白质的三级结构。3)TTG1位点的证据表明白菜和甘蓝是甘蓝型油菜的基因供体BnTTG1-1和BrTTG1-2之间有着极高的同源性,基因组序列和编码区序列的一致性分别达到97.2和99%。BnTTG1-2利BoTTG1-1之间也具有极高的同源性,mRNA核苷酸序列和编码区序列的一致性分别达剑98.7%和98.3%。此外,从内含子的一致性、5’UTR中的AG重复序列的位置与长度、基因序列中的特征性变异碱基、氨基酸序列中的特征性变异氨基酸等方面,都表明BnTTG1-1对应于BrTTG1-2,BnTTG1-2对应于BoTTG1-1,说明甘监和白菜的确为甘蓝型油菜提供了遗传物质。本研究从功能基因家族成员的全长序列比较克隆的角度,为揭示甘蓝型油菜与其亲本物种间的进化关系提供了直观而具体的分子证据。4)揭示了TTG1基因家族的一些新的特征在所克隆的芸薹属三个物种的TTG1基因中,转录起始位点和poly(A)加尾位点存在着丰富的多态性。这种转录起始位点和poly(A)加尾位点的多态性,它们究竟是代表了一种顺式调控方式,还是由于转录起始和poly A加尾过程中的允许误差而造成的,值得研究。TTG1蛋白在蛋白水平具有极度保守性。芸薹属TTG1基因在基因组水平以及编码区有一定的差异,但是他们在蛋白水平上有着非常高的同源性,一致性为98.50%~100%,相似性为99.1%~100%。同时它们与AtTTG1也具有很高的同源性,一致性为92.4%~93.0%,相似性为95.04%~95.9%。芸薹属TTG1基因与单子叶植物也具有很高的同源性,甚至与人和动物的相应蛋白也具有很高的同源性,尤其是在蛋白的中段以及C端十分保守,这一保守性主要表现在物种间编码区的高度保守性以及相似氨基酸的取代。这种趋势主要在看家基因以及一些重要的结构基因中发现,而转录因子的分化一般比结构基因快。虽然TTG1基因编码转录因子,但它的保守性甚至超过了一些结构基因。TTG1基因的定向进化反应了碱基构成的物种偏好性。首先,甘监型油菜、白菜和甘监TTG1基因的ATG前的5’UTR区域与AtTTG1存在很大的筹异,从比对结果可以看出序列发生了定向进化,从而产生了20bp左右的GA重复序列。该GA重复序列是否参与对芸薹属TTG1基因的转录效率或翻泽效率的调控,值得探索。对比拟南芥和芸薹属TTG1基因的GC含量发现,芸薹属TTG1基因编码区的GC含量高于拟南芥TTG1基因的编码区的GC含量。造成这一结果的原因是在AtTTG1中主要是G/C被A/T所取代,而在芸薹属TTG1基因中主要是A/T被G/C所取代。与AtTTG1相比在芸薹属TTG1基因中A/T被G/C取代占碱基变化的绝大部分比例,达到了72.51%。在上述的碱基定向替代进化中C被T取代的比例最高,达到了53.59%。这种现象的直接结果就是芸薹属的TTG1基因编码区的GC含量高于拟南芥TTG1基因编码区GC含量。TTG1基因碱基的种属特异偏好性与细胞色素氧化酶Ⅱ的研究结果是相同的。RT-PCR检测表明,甘监黑籽系06K158与黄籽系06K165间、白菜黑籽系06K130与黄籽系06K124间蕾、花、早期阶段种子中TTG1基因总体表达无实质性差异,但亲本物种在种子发育的中、后期TTG1基因的总体表达水平有所下调,说明TTG1参与了甘蓝06K165和白菜06K124中的黄籽性状的形成,但贡献有限,可能是由于代谢途径的反馈抑制,而主效位点可能是其它基因。甘蓝型油菜近等位基因系L1(黑籽)与L2(黄籽)间,发育中的种子直到开花后30天都没有实质性差异,说明L2黄籽性状的形成中TTG1的贡献史小或没有参与。由于野生开型、功能性的TTG1基因调控种皮色素的合成与积累,产生黑籽性状,理论上抑制芸薹属物种TTG1基因的表达就可能产生类似于拟南芥ttg1突变体的黄籽性状。虽然本研究结果表明上述甘蓝型油菜、甘蓝、白菜的天然突变体黄籽材料中TTG1不是黄籽形成的主要原因,但这3个物种中TTG1基因家族的克隆为通过人工显性基因沉默技术创造转基因新型黄籽材料奠定了基础。5)甘蓝型油菜及其亲本物种TT18基因家族的全长序列的克隆采用RACE技术,分别克隆了甘蓝型油菜、甘监、白菜TT18基因家族5、2、3个成员的全长cDNA和对应的全长基因组序列。甘蓝型油菜BnTT18-1、BnTT18-2、BnTT18-3、BnTT18-4、BnTT18-5的全长基因组序列分别为1875bp、1508bp、1897bp、1972b、1491bpp,典型的全长mRNA(不计Ploy(A)尾巴,下同)分别为1481bp、1421bp、1477bp、1279bp、1404bp。甘蓝BoTT18-1、BoTT18-2的全长基因组序列分别为1923bp、1491bp,典型的全长mRNA分别为1482bp、1404bp。白菜BrTT18-1、BrTT18-2、BrTT18-3的全长基因组序列分别为1898bp、1489bp、1491bp,典型的全长mRNA分别为1478bp、1399bp、1404bp。芸薹属3个物种TT18基因家族成员大部分均具有一个1074~1077bp的开放读码框(ORF,含终止密码子),发生提前终止的BnTT18-2的开放读码框只有338bp;5’UTR长度介于41~144bp:3’UTR长度介于161~322bp。这是在芸薹属植物首次全面系统克隆TT18基因,为深入研究TT18基因的功能、进化、调控模式奠定了基础,也为通过操作TT18基因来人工修饰芸薹属物种的籽色、花色、茎秆颜色等性状奠定了基础。6) BnTT18-1、BnTT18-3、BnTT18-4、BnTT18-5、BoTT18-1、BoTT18-2、BrTT18-1、BrTT18-2、BrTT18-3符合TT18基因的典型特征推导的BnTT18-1、BnTT18-3、BnTT18-4、BnTT18-5、BoTT18-1、BoTT18-2、BrTT18-1、BrTT18-2、BrTT18-3编码337~338个氨基酸残基的蛋白,分子量(Mw)分别为40.86、40.86、40.83、40.89、、40.86、40.86、40.84、40.87、40.77、40.86kD,等电点(p1)为5.13~5.30,都为酸性蛋白,均以谷氨酸最丰富,酸性氨基酸多于碱性氨基酸。用NetPhos 2.0预测它们都存在较多的潜在磷酸化位点,BnTT18-1、BnTT18-3、BnTT18-4、BnTT18-5、BoTT18-1、BoTT18-2、BrTT18-l、BrTT18-2、BrTT18-3的位点数分别为10、13、12、7、10、7、13、7、7,所以磷酸化可能参与它们的蛋白活性调节。它们均没有预测到信号肽和跨膜域,预测它们均可能定位于细胞质内。保守域搜索结果表明,芸薹属TT18家族成员间的蛋白非常相似,都含有两个保守域,一个为c101206(依赖铁离子的2-酮戊二酸双加氧酶超家族),另外一个为COG3491(PcbC,异青霉素-N-合成酶相关的双加氧酶),因此芸薹属TT18家族蛋白均属于2-酮戊二酸的双加氧酶家族。用SOPMA二级结构进行预测表明,芸薹属TT18家族成员蛋白的二级结构非常相似,主要由α螺旋、延伸链和随机卷曲构成,其中随机卷曲所占比例最高,α螺旋所占比例略低,β转角所占比例最少,不足10%。芸薹属TT18蛋白与拟南芥TT18蛋白的二级结构十分相似,在整个分子分布着15~16个大小不等的α螺旋,而且这些α螺旋所处的位置也是基本一致的,这些螺旋都是通过延伸链或者随机卷曲连接起来。Swiss-Model预测表明,芸薹属家族TT18家族蛋白的三级结构几乎是相同的。在自动比对PDB数据库的模板时发现,与芸薹属家族TT18蛋白相似性最高的蛋白是拟南芥TT18(ANS),芸薹属TT18蛋白与拟南芥TT18蛋白lgp6A.pdb模型存在83.5%~92%的一致性。构建芸薹属TT18家族蛋白的三维模型所得到结果与已知结构和功能的拟南芥TT18蛋白的三级结构很相似。芸薹属TT18家族蛋白与AtTT18蛋白一样,β-片层围成了一个扭曲的果冻状结构,这一结构是2-ODD酶的典型特征,普遍存在于2-ODD酶的三级结构中,但在其他酶的三级结构中却极为罕见。核苷酸序列和氨基酸序列的BLAST分析、序列两两比对和多重比对、序列的系统发生分析均表明,它们与AtTT18有最高的相似性。从基因结构、蛋白结构、序列同源性三个方面分析,均显示它们是AtTT18的垂直同源基因,具有TT18的典型特征。7)TT18位点的证据表明白菜和甘蓝是甘蓝型油菜的基因供体BnTT18-1与BoTT8-1之间有着极高的同源性,基因组序列和编码区序列的一致性分别达到97.5%和99.0%。BnTT18-2与BrTT18-2之间有着极高的同源性,基因组序列和编码区序列的一致性分别达到95.3%和95.6%。BnTT18-3与BrTT18-1之间有着极高的同源性,基因组序列和编码区序列的一致性分别达到99.3%和99.0%。BnTT18-5与BrTT18-3之间有着极高的同源性,基因组序列和编码区序列的一致性分别达到100%和100%。其种间基因的一致性高于甘蓝型油菜种内成员之间的一致性。因此,BnTT18-1来自于甘监的BoTT18-1,BnTT18-2来自于白菜的BrTT18-2,BnTT18-3来自于白菜的BrTT18-1,BnTT18-5来自于白菜的BrTT18-3,基因序列中的特征性变异碱基以及系统发生关系来看,更支持这一结论。BnTT18-4和BoTT18-2没有找剑各自对应的基因,因此对芸薹属TT18基因家族的EST、GSS序列进行了搜索并进行了比对分析,结果发现BnTT18-4与白菜的GSS序列DU984686.1和DU984271.1、EST序列EX080049.1具有对应性。BoTT18-2与甘蓝型油菜的的EST序列CD 828811.1、EG020755.1、EV0.39607.1、EL62498.1、EE471700.1、EV016901.1具有对应性。以上比对结果可能说明,BnTT18-4来源于白菜,而甘蓝型油菜中还有一条对应于BoTT18-2的基因的全长尚待克隆,我们命名为BnTT18-6。因此,BnTT18-2、BnTT18-3、BnTT18-4、BnTT18-5来自于白菜(AA组),而BnTT18-1、BnTT18-6则来自于甘监(CC组)。TT18基因数目的互补性以及发生学上的对应关系说明,甘蓝和白菜的确为甘监型油菜提供了遗传物质。本研究从功能基因家族成员的全长序列比较克隆的角度,为揭示甘蓝型油菜与其亲本物种间的进化关系提供了直观而具体的分子证据。需要指出的是,TTG1位点上甘监型油菜的基因数并不是白菜和甘蓝基因组的总和,亲本物种中的一些基因成员在甘蓝型油菜中不存在。TT18位点上,同为二倍体物种的白菜和甘蓝间在基因成员数上明显不同。这些为芸薹属的物种进化提出了一些复杂性因素,有待于进一步阐明。