论文摘要
本文构建了三疣梭子蟹部分基因组文库,对片段长度为5001500bp的4164个克隆进行测序,在此基础上分析了微卫星和小卫星在基因组上的分布特征。利用筛选的含有微卫星的克隆序列,设计出30对微卫星引物,并筛选出了9对多态性引物。对三疣梭子蟹部分基因组DNA文库测序,获得了总长度622 409个碱基的基因组DNA序列,从中找到微卫星重复序列(1-6bp重复)697个。统计微卫星重复类型,以两碱基重复数目最多,为445个,占微卫星序列总数目的63.84 %;其次是三碱基,152个,占21.81%;再次分别是单碱基,45个,占6.46%;四碱基,31个,占4.45%;五碱基,14个,占2.01%;六碱基,10个,占1.43%。在单碱基重复类型中,重复拷贝类别全部为A;两碱基重复类型中,AG重复数目最多,其次是AC和AT;三碱基重复类型中以ACT最多,其次是AGG和AAT;四碱基重复类型中, AGAC重复数目最多;五碱基重复类型中,以AACCT重复拷贝类别最多;六碱基重复中以AGGGGA重复数目最多。GC重复拷贝类别的重复数目很少,只发现1个(注册号为EU113241)。在序列拼接后长度500~1500bp的709个克隆中,筛选到130个小卫星序列,其序列总长度占测序序列总长度的2.55%。小卫星序列中,以12bp重复单位的序列数量最多(10.77%),总体趋势表现为重复单位越长,相应的重复序列数目越少(R=-0.663,p<0.01)。小卫星重复单位拷贝数分布范围以8bp重复单位最广为3.9~66.5;其次是13bp重复范围在2.0~40.6;再次是26bp重复,范围在2.3~21.0。平均拷贝数最高的三种重复类型分别为8bp重复(19.96),25bp重复(16.00)和22bp重复(15.85)。小卫星序列中各重复单位的拷贝数分布范围2~66.5,集中分布在2~25,且表现为拷贝数目越大,其相应的重复序列数目越低的趋势。130个重复序列分别由123种重复单位所组成,因而小卫星重复序列的类型很多。我们初步分成三类:两种碱基组成类别、三种碱基组成类别和四种碱基组成类别,并进一步根据各个重复序列中所含有的碱基种类的数量从大到小排列这些碱基而分成若干小类。从这些分类中可以看出,三疣梭子蟹基因组中的小卫星整体上是富含A/T的重复序列,并揭示了其与微卫星重复序列之间的关系,即一部分小卫星重复序列可能起源于微卫星序列。对蟹类微卫星分离方法、引物设计、遗传学特性以及在种群遗传、家系分析、遗传多样性评价等方面的最新研究进展进行了综述,并分析了微卫星分析中无效等位基因(null allele)、“结巴”带(stutter bands)和上游等位基因“扩增丢失”现象(upper allelic dropout)的产生原因以及对微卫星基因型判读带来的影响。根据建立的三疣梭子蟹部分基因组文库,筛选其中含有微卫星序列的克隆设计引物。在709个克隆测序序列中,找到包含完整侧翼序列(长度大于50bp)的重复序列,设计了30对微卫星引物,从中筛选出了9对微卫星多态性引物。