基于生物信息学的冷休克结构域蛋白家族进化研究

基于生物信息学的冷休克结构域蛋白家族进化研究

论文摘要

本文基于公共数据库数据,以冷休克结构域(cold shock domain)蛋白超家族为例,利用生物信息学的理论和方法,对冷休克结构域蛋白超家族的分子进化进行深入研究,目的是揭示冷休克结构域蛋白超家族基因起源和进化的分子机制以及基因非编码区调控作用,并为深入研究其他基因家族以及超家族进化机制提供新的思路和方法。本文的主要研究结果如下:(1)运用NJ法和ML法对84条冷休克结构域蛋白的氨基酸序列进行系统发育进化树构建,发现该系统发育树由3个大簇(CladeⅠ、CladeⅡ和CladeⅢ)构成,其中CladeⅠ是包含物种种类最多的一簇,从鱼类黑青斑河豚到哺乳动物人类,从基因结构看这一簇成员基本都包含长度为64、34、90的外显子,并且内含子的插入相位也大致相同,这个位置正是编码冷休克结构域的氨基酸位置,说明冷休克结构域在这些成员当中是很保守的;CladeⅡ多是无脊椎动物一簇,从低等的克氏锥虫到蜜蜂、果蝇,该簇在基因结构上表现为外显子数目少,且碱基数较多,同时在线虫中还发现4种旁系同源产物Cey1、Cey2、Cey3和Cey4蛋白;CladeⅢ是植物一簇聚集到一起,从系统发育树中看CladeⅢ和CladeⅡ聚集在一个树枝上,该簇含有的外显子数目也是很少的,且内含子数量少甚至不含有内含子。(2)通过对氨基酸序列motif进行分析,发现高等动物比低等动物含有更多数量的motif,而在植物中含有的motif数量更少,但植物中单个motif种类的重复则较多。(3)对冷休克结构域蛋白基因的mRNA的3′、5′UTR区域进行研究,结果表明在3′UTR区域的功能元件比5′UTR区域的多。采用同源序列比对发现在UTR区域的序列保守性相对较差,碱基间也发生了较大的突变。(4)对各个冷休克结构域蛋白基因中的内含子做重复序列分析,发现在由无脊椎动物到脊椎动物进化的过程中,内含子重复序列元件在增多,但重复序列元件增加的数量各有不同,说明内含子在插入外显子中的位点也相应的增多。此外,亲缘关系相近的物种,其重复序列元件在基因结构上又具有一定的相似性。更进一步的研究发现重复序列元件的种类与内含子总长度和GC含量密切相关。通过对上述研究结果的综合分析,初步模拟出了冷休克结构域蛋白家族的进化模型,即在物种形成冷休克结构域蛋白的初期是由基因复制产生直系同源蛋白,随着物种的进化由于选择性剪接进而产生旁系同源蛋白,从而使得该蛋白家族成为一个多功能蛋白家族。本文的研究结果也为更深入地研究基因家族以及超家族进化机制提供了新的方法和启示。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 基因与基因组进化研究中的生物信息学
  • 1.1 生物信息学概述
  • 1.2 比较基因组学与进化基因组学
  • 1.2.1 比较基因组学与生物进化
  • 1.2.2 进化基因组学与生物进化
  • 1.3 基因家族进化研究中的若干概念简述
  • 1.3.1 基因家族与蛋白质家族
  • 1.3.2 系统发生分析与系统发生树
  • 1.3.3 基因或蛋白家族分析方法和步骤
  • 1.3.4 基因家族进化研究中存在的问题
  • 第二章 冷休克结构域蛋白家族研究进展
  • 2.1 原核生物冷休克蛋白对低温环境的应答
  • 2.2 真核生物冷休克结构域蛋白的研究
  • 2.2.1 无脊椎动物Y-box蛋白的研究
  • 2.2.2 脊椎动物Y-box蛋白的研究
  • 2.2.3 人类YB-1蛋白对肿瘤发生的影响
  • 2.3 植物冷休克蛋白对低温环境的应答
  • 第三章 日本七鳃鳗口腔腺Y-box基因Lyb的克隆
  • 3.1 材料和方法
  • 3.1.1 材料
  • 3.1.2 方法
  • 3.2 结果
  • 3.2.1 日本七鳃鳗总RNA的提取和Y-box基因CSD区域的克隆
  • 3.2.2 3'、5'RACE克隆产物
  • 3.2.3 日本七鳃鳗Y-box结合蛋白基因的全长序列
  • 3.2.4 蛋白质的功能位点分析
  • 3.2.5 蛋白质序列多重比对和进化树的构建
  • 3.3 讨论
  • 第四章 冷休克结构域蛋白超家族的分子进化及其起源机制的探讨
  • 4.1 数据的获得
  • 4.2 分析方法
  • 4.3 结果
  • 4.3.1 Y-box基因家族成员的聚类
  • 4.3.2 保守基序motif的分析
  • 4.3.3 Y-box基因3'和5'非翻译区(untranslated region)序列分析
  • 4.3.4 Y-box基因家族的内含子系统发育分析
  • 4.4 Y-box基因家族的进化模型
  • 第五章 全文小结
  • 参考文献
  • 附录
  • 附录 1:文章中所选物种一览表
  • 附录 2:基因结构示意图
  • 附录 3:氨基酸保守序列motif的MEME分析结果示意图
  • 附录 4:具有CPE功能元件物种的3'UTR序列做的同源比对
  • 附录 5:具有IRES功能元件物种的3'UTR序列做的同源比对
  • 致谢
  • 研究成果及学术论文
  • 个人简历
  • 相关论文文献

    • [1].结构域B在鼠冠状病毒S蛋白的抗原性及膜融合中的作用[J]. 微生物与感染 2020(01)
    • [2].碳水化合物结合结构域研究进展[J]. 微生物学报 2017(08)
    • [3].蛋白质结构域划分方法及在线服务综述[J]. 广州大学学报(自然科学版) 2019(01)
    • [4].PDZ结构域有望成为新药靶点[J]. 中国新药杂志 2019(11)
    • [5].含溴结构域和额外终端域家族蛋白——表观遗传领域的新型治疗靶点[J]. 药学学报 2017(08)
    • [6].纤维连接蛋白B结构域的生物学特征及其靶向药物开发[J]. 药学学报 2017(08)
    • [7].多结构域酶的结构域进化关系[J]. 生命的化学 2012(01)
    • [8].共调控共互作蛋白结构域的特征研究[J]. 中国优生与遗传杂志 2010(03)
    • [9].核定位蛋白的结构域特征分析[J]. 内蒙古大学学报(自然科学版) 2018(01)
    • [10].免疫球蛋白结合结构域的研究进展[J]. 药物生物技术 2012(03)
    • [11].毕赤酵母高密度发酵表达血管紧张素转化酶C-结构域[J]. 中国生物工程杂志 2010(04)
    • [12].精氨酸激酶C端结构域的克隆及其表达纯化[J]. 化学与生物工程 2010(06)
    • [13].整合素αMβ2 I-结构域的基因合成和蛋白表达[J]. 生物技术通讯 2009(01)
    • [14].酰基辅酶A结合结构域蛋白3在病原微生物复制中的作用[J]. 生物化学与生物物理进展 2017(03)
    • [15].海洋放线菌代谢产物、非核糖体多肽、腺苷化结构域研究进展[J]. 华中师范大学学报(自然科学版) 2015(01)
    • [16].木聚糖酶碳水化合物结合结构域研究进展[J]. 生物工程学报 2010(03)
    • [17].猪乙型脑炎病毒E蛋白结构域Ⅲ原核表达和抗原性分析[J]. 中国畜牧兽医 2016(04)
    • [18].Ⅰ型聚酮合酶中酰基转移酶结构域的研究进展[J]. 有机化学 2018(09)
    • [19].溴结构域蛋白4及其抑制剂的研究进展[J]. 中国药学杂志 2017(15)
    • [20].西尼罗病毒糖蛋白第三结构域的原核表达及鉴定[J]. 中国兽医学报 2016(01)
    • [21].结构域相互作用数据库的产生、发展与应用[J]. 生物化学与生物物理进展 2009(03)
    • [22].LSECtin CRD结构域的运行性研究[J]. 生物物理学报 2009(S1)
    • [23].人源血管紧张素转化酶-C结构域在毕赤酵母中的表达[J]. 生物工程学报 2010(05)
    • [24].中国山西省部分地区人群肌节同源型结构域1基因与非综合征性唇腭裂的关联性[J]. 中国组织工程研究与临床康复 2010(28)
    • [25].PICK1的结构与功能研究进展[J]. 现代生物医学进展 2008(10)
    • [26].鹅坦布苏病毒E蛋白结构域Ⅲ的原核表达及抗原性分析[J]. 南方农业学报 2015(01)
    • [27].鸭维甲酸诱导基因I克隆及其结构域功能分析[J]. 中国农业科学 2013(10)
    • [28].一种基于支持向量机的蛋白质结构域边界预测方法[J]. 吉林大学学报(理学版) 2008(05)
    • [29].细胞分裂周期蛋白42结构域突变真核表达质粒的构建与鉴定[J]. 解剖学杂志 2019(03)
    • [30].死亡受体6的胞内结构域对其亚细胞定位的调节[J]. 生物物理学报 2014(02)

    标签:;  ;  ;  ;  ;  

    基于生物信息学的冷休克结构域蛋白家族进化研究
    下载Doc文档

    猜你喜欢