论文摘要
含有大片段基因组DNA的BAC文库是基因图位克隆、物理作图、基因组测序和新分子标记发掘的重要工具。为了对棉花基因组进行深入地研究,构建更多插入片段大、基因组覆盖率高的BAC文库是必不可少的。本研究在Zhang HB BAC文库构建方法的基础上,作了一些改进,建立了一套高效的棉花BAC文库构建技术体系,包括高分子量基因组DNA的提取、部分酶切最佳条件的确定、片段大小的选择、高效连接转化体系等。利用所建立的高效BAC文库构建技术体系,以pIndigoBAC-5为载体,分别选用亚洲棉(基因型A2A2)和陆地棉(基因型AADD)为材料构建了基因组BAC文库。这些新的BAC文库连同已经构建的棉花的BAC文库是棉花基因组研究的重要资源。所构建的亚洲棉品种江陵中棉BAC文库,共包括123,648个单克隆,保存于322块384孔培养板中。以亚洲棉基因组大小为1690Mb计算,此文库相当于7.2倍亚洲棉基因组大小。随机挑取103个单克隆,Not I酶切释放插入片段,电泳检测得到所插入片段范围为30-190 kb,平均为100.2 kb,空载率<1%。随机挑取6个BAC克隆进行稳定性测验,实验证明BAC克隆单个克隆可以在宿主大肠杆菌中稳定繁殖至少100代,不发生插入片段的丢失和酶切带型的改变。同时,为了便于通过PCR技术对文库进行筛选,还构建了该文库的混合池。混合池分为二级,一级为行池(Row Pool)和列池(Column Pool);二级为超级混合池。混合池的建立极大地方便了对文库的筛选。通过筛选江陵中棉BAC文库的方法,得到了含有GaMYB7基因的阳性单克隆,以此作为Tail-PCR的起始模板,获得的总长度1566bp的GaMYB7基因上游序列。经过序列分析确定了转录起始位点(Transcription Start Site,TSS)、TATA-box和CAAT-box。通过序列分析发现,该序列包含多个光调控元件,还具有生长素和赤霉素应答的基本结构。在此基础上,构建了3个5’端含不同应答元件的启动子片段驱动GUS基因的植物表达载体。通过基因枪转化棉花胚珠瞬时表达实验发现,三个启动子片段均能指导报告基因在棉花胚珠中正常表达。因此,GaMYB7启动子可用于研究棉花纤维的发育、品质改良以及外源基因在棉花纤维中的特异表达。所构建的陆地棉遗传标准系TM-1 BAC文库共有170.880个单克隆,保存于445块384孔中。随机挑取110单克隆,用Not I酶切,得到所插入片段范围为97-240 kb,平均插入片段为122.8 kb;空载率<1%;96%的克隆插入片段>100 kb。以陆地棉基因组大小为2425Mb计算,此文库相当于8.6的单倍棉花基因组大小。同样,为了便于通过PCR技术对文库进行筛选,构建了该文库的混合池。Column-Pool库保存于19块384孔板中,每孔由24个单克隆混合而成,标号为CP1-CP19。Super-pool保存于2块384孔板中,每孔由384(24×16)个单克隆混合,共456个。Giant-pool由Super-pool混合而成,共114个,每孔由1536(24×16×4)个单克隆混合而成。从此文库中筛选一个阳性单克隆大约需要158个PCR反应。陆地棉12号及26号染色体系部分同源染色体。目前一些重要的农艺性状基因已被定位在这两条染色体上。为了图位克隆这些重要的农艺性状相关的基因,需要构建这两条染色体的物理图谱。我们以遗传图谱上定位在这两条染色体上的分子标记进行BAC文库的筛选,筛选到的阳性单克隆总数为607个,平均为每个标记约4个克隆。各个标记筛到的阳性单克隆数从1到16个。12和26号染色体上共有的克隆共68个。有共同克隆的标记分为21组,49个标记。通过比较发现,这些筛选到相同克隆的标记一般在遗传图谱上的遗传距离也比较近,这也验证了遗传图谱的准确性。还有一些标记如NAU3294和NAU3293, BNL1673和NAU1463, NAU4095和NAU3905, NAU3441和NAU3442,分别位于不同的染色体上,但是也筛选到了共同的克隆,说明这一对引物所处的位置为同源染色体区段。这也证明了12和26号染色体部分同源。提取了全部380个阳性单克隆(从607个克隆中去除了一些重复的共同克隆)的质粒,进行HindⅢ酶切,获得了每个单克隆的酶切指纹图谱,通过Image3.10b和FPCV8.5软件的分析,初步构建了12和26号染色体的重叠群。