论文摘要
转录因子结构上主要由DNA结合结构域(DNA binding domain, DBD)、转录激活/抑制结构域和核定位信号三部分组成。DBD与靶基因转录调控区中顺式作用元件的特异性识别是转录因子对靶基因进行调控的前提和基础。本文对来自于老鼠和拟南芥的不同转录因子对各自顺式作用元件的识别机制进行了深入研究。鼠转录因子c-Myb的DBD由3个串联的重复结构域R1、R2和R3做成,能够特异性识别靶基因调控区中含有AACNG-基序的顺式作用元件,R2R3是Myb DBD能够完成特异性DNA识别的最小结构部分。靶基因mim-1的调控区中含有3个Myb特异性结合位点A、B、C,其中A位点具有独特的准回文结构双AACNG-基序,而B、C位点只含有单个的AACNG-基序。为了明确c-Myb识别双AACNG-基序的内在机制,我们通过体外实验和计算机模拟的方法对该结合反应进行了详细分析。体外结合实验表明,R2R3选择性识别A位点中位于正义链上的5’-TAACGG-3’基序,其反应机制符合Myb对其他PyAACNG-基序的识别机理,即R3对AAC核的保守性识别和R2对后半位点GG的可调性识别。同时,分子动力学模拟数据,如蛋白质局部构像变化分析、DNA局部结合诱导的弯曲性分析以及蛋白质-DNA直接作用分析的结果都与上述体外结合分析的结果相一致。DNA的局部构像和可变形性决定了正义链上的5’-TAACGG-3’基序更适合被R2R3特异性识别。这些结果表明c-Myb与该双AACNG-基序结合反应是通过不对称的识别机制完成的,而该识别机制对于c-Myb特异性调控靶基因具有重要意义。拟南芥ERF转录因子家族由约120个成员组成,每个成员都含有保守的ERF结构域。了解ERF家族成员的DNA结合特异性与DBD结构的关系,我们从ERF家族不同的系统发生组选取了4个成员:AtERF1、AtERF4、AtEBP和CBF1。其中AtERF1、AtERF4和AtEBP来自于ERF亚家族的不同进化分支,能够特异性识别乙烯效应元件GCC-box(核心基序GCCGCC, GCC-motif),而CBF1来自DREB亚家族,特异性结合脱水效应元件/C-repeat元件(核心基序为ACCGAC, DRE-motif)。电泳迁移率变化分析结果显示,这4个蛋白的ERF结构域都能特异性识别DRE-基序和GCC-基序,各ERF结构域的基序的偏好性与其系统发生分组呈直接对应关系。随机序列筛选确定了4个ERF结构域的特异性识别基序,AtERF1、AtERF4的特异性识别基序与GCC-基序具有较大的相似性, CBF1的特异性识别基序则与DRE基序相近,所有筛选得到的基序都含有共同的cCG*c核心序列。我们以DRE基序作为范例比较上述4个ERF结构域识别同一基序结合时的结合特征,体外和体内的分析结果都表明,4个ERF结构域对cCG*c基序核心序列CG识别具有共同特征,而对于其他位置侧翼序列碱基c的识别显示出不同的结合特征。结果表明,共同的CG识别特征可能是ERF结构域与其识别基序发生特异性结合的基础,是结构域中保守氨基酸残基赋予家族成员的共同特征;而不同的侧翼序列碱基偏好性能保证ERF成员区分具有相似基序结构的顺式元件,可能是由家族/亚家族特征性分布的氨基酸残基决定的。