论文摘要
基因重复是在生物体细胞内产生相似DNA片段的事件,是真核生物中重要的生物学过程,并在物种演化过程中扮演重要角色。基因重复能够为生物体基因组的演化及新功能基因的产生提供最基本的物质和原材料基础,并由此导致新物种的诞生。生物体通过基因重复事件来增加基因组中基因的拷贝数,以适应不同环境及发育的需要。因此,对基因重复遗传规律的研究,可进一步了解生物体演变规律,为人工定向改造基因、人为创造新基因以提高物种品质提供理论基础。本文从12个已测序的、全球分布的果蝇基因组中,鉴定出了 22488个基因家族,其中存在新近重复的基因家族共3647个,占基因家族总数的16.2%。依据不同的扩张模式,我们进一步将这些新近重复基因家族分为三类:物种特异性扩张、世系特异性扩张及复杂型扩张基因家族。其中第一种扩张类型占据了极大的比例(86.6%)。在同一个复杂型扩张基因家族中,存在多个不同物种之间发生独立的物种特异性基因重复事件;在物种特异性扩张基因家族中,不同物种共有新近基因重复热点。这些结果表明,这些新近重复基因受到趋同演化的作用。通过对新近重复基因蛋白质结构域的比较发现,新近重复基因具有功能偏好性,并多与应对环境刺激及生物胁迫有关。对新近重复基因的旁系同源基因和直系同源基因的非同义替换率(Ka)和同义替换率(Ks)的计算发现,部分基因受到正选择压力的驱动(Ka/Ks>1)。对这些受正选择作用的新近重复基因家族的功能评估表明,其存在功能偏好性,并与其地理分布、食物来源等因素相关。说明,果蝇基因组中的新近重复的基因为了应对不同的生态环境而受到了适应性演化的驱动。为了进一步验证重复基因对于环境、发育过程等因素的适应性,我们对果蝇基因组中的胰蛋白酶基因家族以及线虫基因组中的patched同源基因家族的扩张和演化模式进行了进一步探讨。首先,在12个果蝇物种中,我们发现了 2598个胰蛋白酶基因拷贝,平均每个物种中有217个,但这些基因拷贝在12个物种中分布并不均匀,数目从167到258个不等。那些具有相近亲缘关系的物种基因组内胰蛋白酶基因拷贝数比较相近,说明胰蛋白酶基因重复事件与果蝇物种的系统发生相关。以腐烂水果为生的果蝇基因组中胰蛋白酶拷贝数显著大于以腐烂树木为生的果蝇,且分布于非洲的物种基因组内的胰蛋白酶数要显著高于分布于美洲或亚洲的物种,因此,食物来源在胰蛋白酶基因演化过程中起到十分重要的作用,而地理分布则作为一种附加的诱导因素。通过推断胰蛋白酶基因重复事件发生的时间发现,这些重复事件并非同时发生,而是与生态环境的改变或是宿主改变相关的。此外,我们还发现,狭生性物种相对广生性物种具有较高的Ka/Ks值以及动态的基因重复/缺失事件。说明,该家族的基因重复在果蝇适应不同生态环境中起到了重要的作用。其次,对patched同源基因家族的研究表明,patched同源基因在植物和动物中都比较保守,而且patched同源基因的扩张事件应该发生在线虫物种形成的早期。通过对系统发生树、基因和物种的协调树的研究以及对Ks值的计算发现,PTR类型基因在线虫物种形成之后相对较短的时间内发生了两次扩张。此外,相对近期起源的patched同源基因相较于相对古老起源的patched同源基因,它们的外显子数目较少并且CDS长度较短。不同类型的patched同源基因具有不同的演化模式,PTR类型基因的扩张有利于线虫特异性的适应。本文通过近缘物种中重复基因的比较发现,尽管不同的基因重复家族存在不同的基因功能偏好及遗传变异特征,但纵观整个研究,这些基因重复却具有极相似演化模式,那就是适应性演化在重复基因的演化历程中扮演了重要的角色。
论文目录
前言中文摘要英文摘要主要缩略词第一章: 绪论-基因重复现象的研究现状1.1 引言-基因重复现象的概述1.2 基因重复的产生机制1.2.1 不等交换(unequal crossing over)1.2.2 逆转录转座(retroposition)1.2.3 染色体或基因组范围的重复(chromosomal or genome duplication)1.3 重复基因的演化模型(evolutionary models)1.3.1 第一大类1.3.2 第二大类1.3.3 第三大类1.3.4 第四大类1.4 重复基因的演化命运1.4.1 假基因化(pseudogenization)1.4.2 亚功能化(subfunctionalization)1.4.3 新功能化(neofunctionalization)1.5 基因重复演化上的贡献1.5.1 提供演化必要的材料1.5.2 基因表达多样性的增加1.5.3 物种的适应性演化1.6 果蝇、线虫中基因重复的研究进展1.6.1 果蝇中基因重复的研究1.6.2 线虫中基因重复的研究1.7 本研究的背景、目的和意义1.8 参考文献第二章: 功能需求驱动的12个果蝇基因组中新近重复基因的适应性演化2.1 引言2.2 材料与方法2.2.1 实验材料2.2.2 新近重复基因家族的鉴定2.2.3 新近重复基因家族系统发生树的构建2.2.4 染色体上新近重复热点的随机模拟2.2.5 新近重复基因家族的结构域预测2.2.6 新近重复基因同义替换率、非同义替换率以及重复年代的计算2.3 结果2.3.1 新近重复基因家族的数目及分类2.3.2 新近重复基因家族的染色体分布2.3.3 新近重复基因家族的功能偏好2.3.4 旁系同源基因(paralog)与直系同源基因(ortholog)的选择压力2.3.5 新近基因重复事件的发生年代对比2.4 讨论2.4.1 新近重复基因的趋同演化2.4.2 新近重复基因的适应性演化2.4.3 适应性演化驱动特异性功能偏好2.5 小结2.6 参考文献第三章: 新近基因重复驱动12个果蝇基因组中胰蛋白酶(Trypsin)基因的快速演化3.1 引言3.2 材料与方法3.2.1 实验材料3.2.2 胰蛋白酶基因的鉴定3.2.3 胰蛋白酶基因家族系统发生树的构建3.2.4 胰蛋白酶基因家族复制/缺失事件的统计3.2.5 胰蛋白酶基因家族的同义替换率、非同义替换率以及重复年代的计算3.3 结果3.3.1 胰蛋白酶基因家族的重复/缺失事件的演化模式3.3.2 胰蛋白酶基因家族的重复事件与食物来源相关3.3.3 胰蛋白酶基因重复发生年代3.3.4 驱动胰蛋白酶基因演化的选择压力3.4 讨论3.4.1 胰蛋白酶基因的适应性演化3.4.2 胰蛋白酶基因的辐射型演化模式3.4.3 适应性演化赋予物种差异性3.5 小结3.6 参考文献第四章: Patched同源基因家族的演化模式4.1 引言4.2 材料与方法4.2.1 实验材料4.2.2 Patched同源基因的鉴定4.2.3 基因家族系统发生树4.2.4 协调树(reconciled tree)的构建4.2.5 同义替换率及核苷酸差异度的计算4.2.6 Patched同源基因在秀丽线虫染色体上的分布4.3 结果4.3.1 Patched同源基因数目及分类4.3.2 Patched同源基因家族系统演化分析4.3.3 Patched同源基因在线虫中的重复模式4.3.4 Patched同源基因的外显子(exon)演化模式4.3.5 直系同源基因在三个隐杆线虫属(Caenorhabditis)物种中的比较4.4 讨论4.4.1 Patched同源基因在线虫中的重复模式4.4.2 Patched同源基因在线虫中的基因功能4.5 小结4.6 参考文献全文结论致谢攻读博士期间科研成果附录A附录B
相关论文文献
标签:基因重复论文; 基因家族论文; 适应性演化论文;