基于生物信息学的禽流感H5N1病毒高致病性和传染性的研究

基于生物信息学的禽流感H5N1病毒高致病性和传染性的研究

论文摘要

高致病禽流感H5N1病毒引起了全世界的高度关注。据世界卫生组织和世界动物卫生组织统计,截止2007年8月底,H5N1禽流感疫情已波及亚洲、欧洲、非洲的44个国家,共计5200多起上报的案例;人类感染病例出现在12个国家,共计322例,死亡195人。随着禽流感疫情爆发的范围不断扩大,感染人数不断增多,全世界都在担忧H5N1病毒是否将在人群中大规模爆发,引起比SARS疫情更为严重的灾难。流感大流行需要具备3个条件:(1)必须形成一种新的流感病毒亚型;(2)必须导致人体感染并引起严重病症;(3)必须能在人群中轻易、持续地传播。目前H5N1病毒已经具备上述前两个条件,是一种新的高致病亚型,但是目前仍没有大规模人传人的证据。因此,高致病性与人际传染性是目前禽流感研究领域中迫切需要解决的热点问题。本论文针对这两个热点问题,研究H5N1高致病性的根本原因和人际传染性的基因序列特征。血凝素蛋白前体HA0裂解成两个亚单位HA1和HA2是病毒感染的必要条件。识别和切割HA0的酶有两类:胰蛋白酶类和碱性蛋白酶。能被哪类蛋白酶切割,则主要取决于HA0切割位点上游的氨基酸序列。蛋白酶在宿主细胞内的分布及血凝素蛋白的切割位点序列是影响禽流感病毒致病性的决定性因素。本论文从血凝素蛋白的切割位点与蛋白酶的相互作用出发,运用元胞自动机序列可视化模型、同源模拟和分子对接等方法,来揭示H5N1高致病的根本原因及其致病力的进化规律和方向,得到了以下结果:1.找到了H5N1-H5的特征基因片段,其翻译产物正好是血凝素蛋白的切割位点片段。不仅证明H5N1-H5具有不同于其它亚型病毒的独特的切割位点,也可以为H5N1的快速检测提供新的依据。我们通过元胞自动机基因序列可视化模型将HA的基因序列转化为图形,并在元胞自动机图上找到了H5N1-H5独有的图形特征,这个图形特征对应了一段位于1012bp左右,长度大约为30bps,主要由核苷酸‘A’和‘G’组成的特征基因片段。最普遍的特征基因片段为‘CAAAGAGAGAGAAGAAGAAAAAAGAGAGGA’。将特征基因片段翻译后得到由多个碱性氨基酸组成的多肽片段,位于HA0的切割位点,是H5N1高致病性的决定性因素。2.对NCBI流感病毒数据库中的所有序列进行分析,将存在的21种H5N1-H5切割位点突变类型按照碱性氨基酸的分布与个数分为6类,统计了它们在时间和地域上的分布情况,发现在时间上突变的比例逐年增加,切割位点的碱性氨基酸平均个数从7个逐渐下降到了6个;在地域上,突变类型大都集中在中国大陆和香港,而且有12种突变类型都起源于中国大陆和香港。3.用HA前体蛋白H1N1-H1的晶体结构作为模版,运用同源模拟的方法重建了H5N1-H5的三维结构,发现与低致病H1N1-H1相比,H5N1-H5的切割环更加舒展,切割位点更加暴露,非常有利于各种酶对其进行剪切。4.从分子水平上揭示了H5N1病毒的高致病机理,研究了切割位点的各个子位点与蛋白酶的相互作用,发现P1、P2、P4、P6对高致病具有很大贡献。我们截取了高致病禽流感H5N1-H5切割位点的九肽片段‘RERRRKKRG’和低致病禽流感H1N1-H1切割位点的六肽片段‘SIQSRG’,采用分子对接的方法分别模拟它们被不同蛋白酶——只存在于呼吸道和消化道上皮细胞内的胰蛋白酶和几乎存在于所有细胞内的弗林蛋白酶切割的情况,并从蛋白酶的底物选择性揭示了H5N1的高致病性的原因,即胰蛋白酶对底物的P1子位点有很强的选择性,S1结合口袋的结构和性质,只允许带正电荷的精氨酸和赖氨酸的长侧链伸入,对于其它子位点并没有显示出选择偏好,因此胰蛋白酶既能够识别和切割低致病禽流感H1N1-H1切割位点的六肽片段,又能够切割高致病禽流感H5N1-H5切割位点的九肽片段;而弗林蛋白酶的底物选择性主要依赖于子位点P1、P2、P4、P6,弗林蛋白酶在活性部位富含酸性氨基酸,在多个亚部位(S1、S2、S3、S4、S5、S6、S8)表现出对碱性氨基酸残基的偏好,特别是S1、S4和S6,专为精氨酸设计,即使被置换为赖氨酸,也会导致结合自由能不同程度的减弱,因此弗林蛋白酶只能识别和切割高致病禽流感H5N1-H5切割位点的九肽片段,不能识别低致病禽流感H1N1-H1切割位点的六肽片段。5.从切割位点片段与弗林蛋白酶相互作用的结合自由能变化来评价H5N1病毒致病力的变化,发现致病力进化的规律及方向,即目前占主导地位的突变类型‘GERRRKKRG’、‘RESRRKKRG’和‘RERRRKRG’与弗林蛋白酶对接的结合自由能衰减幅度都很小,几乎不能对病毒的高致病性产生影响,但是如果‘GERRRKKRG’和‘RESRRKKRG’的碱性氨基酸继续发生突变,就会导致结合自由能减弱超过10kcal/mol,使病毒的致病力减弱。20世纪人类发生了3次流感大流行,分别由1918年的H1N1亚型、1957年的H2N2亚型、1968年的H3N2亚型病毒引起。研究发现,1957年的H2N2和1968年的H3N2病毒的8个RNA片段中,有5个(PA、PB2、NP、MP和NS)都起源于1918年的H1N1病毒。可以认为,这5个片段中包含了共同的大流感基因序列特征。我们通过对三次大流感病毒的序列分析找到了与大流感相关的33个特征位点,即PB2的199、475、567、627位点,PA的55、100、241、312、382、400、552、716位点,NP的16、100、136、283、313、357位点,M1的121位点,M2的14、16、20、78、86位点,NS1的21、22、84、114、171、196、215、227、229位点。H5N1病毒在大部分特征位点都不具备大流感基因序列特征,与目前病毒尚不具备大规模人传人的能力的现状是相符的。大流感病毒H1N1和H3N2可能已经在进化过程中丧失了部分大流感基因序列特征,只有人流感病毒H2N2仍可能保留大流感基因序列特征。如果人流感病毒H2N2与禽流感病毒H5N1重组或者多种亚型病毒重组,产生的新病毒继承了人流感病毒PB2、PA、NP、MP、NS上的大流感基因序列特征和H5N1病毒HA的高致病性,那么就可能爆发新一轮的流感大流行。重组极有可能在“基因混合容器”猪体内发生,而中国农村的养殖及其生态环境为这种混合感染和病毒重组提供了理想的环境,我们要密切监控这些大流感特征位点,特别是与功能相关的这些位点的突变情况。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 概述
  • 1.1 引言
  • 1.2 禽流感病毒的形态和结构
  • 1.3 禽流感病毒的基因组组成与编码蛋白质的功能
  • 1.3.1 血凝素(Hemagglutinin, HA)
  • 1.3.2 神经氨酸酶(Neuraminidase, NA)
  • 1.3.3 聚合酶蛋白(Polymerase, PB2、PA 和 PB1)
  • 1.3.4 核蛋白(Nucleoprotein, NP)
  • 1.3.5 基质蛋白(Matrix Proteins, M1 和 M2)
  • 1.3.6 非结构蛋白(Nonstructural Proteins, NS1 和 NS2)
  • 1.4 禽流感病毒的致病性
  • 1.4.1 禽流感的病理特征
  • 1.4.2 H5N1 高致病禽流感的临床特征
  • 1.4.3 高致病禽流感的鉴定标准
  • 1.5 禽流感致病性的研究现状
  • 1.5.1 HA 是禽流感病毒毒力的主要决定因素
  • 1.5.2 NA 对禽流感病毒的毒力有一定的作用
  • 1.5.3 PB2、PA、PB1 单个氨基酸的变化就可能导致流感病毒毒力很大的改变
  • 1.5.4 NS1 对于禽流感病毒在细胞水平上与宿主的相互作用起重要作用
  • 1.5.5 其它基因产物
  • 1.6 论文的目的与意义
  • 1.7 论文的主要研究内容和创新点
  • 1.7.1 主要内容与安排
  • 1.7.2 创新点
  • 第二章 基于元胞自动机基因序列可视化模型的 H5N1-H5 基因序列分析
  • 2.1 NCBI 流感病毒数据库
  • 2.2 元胞自动机
  • 2.2.1 元胞自动机的构成
  • 2.2.2 元胞自动机的特征
  • 2.2.3 初等元胞自动机
  • 2.3 基于初等元胞自动机的序列可视化模型
  • 2.3.1 核苷酸编码
  • 2.3.2 基因序列时空演化
  • 2.3.3 元胞自动机序列可视化模型应用于生物信息学
  • 2.4 基于元胞自动机基因序列可视化模型的 H5N1-H5 基因序列分析
  • 2.4.1 第 216 号规则
  • 2.4.2 H5N1-H5 基因序列 CA 图的特点
  • 2.4.3 H5N1-H5 指纹的基因序列特征
  • 2.5 本章小结
  • 第三章 基于同源模拟的 H5N1-H5 切割位点结构分析
  • 3.1 同源模拟(Homologous Modeling)
  • 3.2 序列比对(Alignment)
  • 3.3 H5N1-Viet04 HA0 结构分析
  • 3.4 H5N1-H5 切割位点片段的进化规律分析
  • 3.5 本章小结
  • 第四章 基于蛋白酶底物选择性的 H5N1 高致病的根本原因及进化规律分析
  • 4.1 分子对接
  • 4.2 蛋白酶
  • 4.2.1 丝氨酸蛋白酶(Serine)
  • 4.2.2 胰蛋白酶(Trypsin)
  • 4.2.3 弗林蛋白酶(Furin)
  • 4.3 不同切割位点片段与胰蛋白酶的对接模拟
  • 4.3.1 九肽‘RERRRKKR↓G’与胰蛋白酶的对接模拟
  • 4.3.2 六肽‘SIQSR↓G’与胰蛋白酶的对接模拟
  • 4.3.3 结论
  • 4.4 不同切割位点片段与弗林蛋白酶的对接模拟
  • 4.4.1 九肽‘RERRRKKR↓G’与弗林蛋白酶的对接模拟
  • 4.4.2 六肽‘SIQSR↓G’与弗林蛋白酶的对接模拟
  • 4.4.3 结论
  • 4.5 H5N1-H5 切割位点突变对高致病性产生的影响
  • 4.6 本章小结
  • 第五章 基于大流感基因序列特征的 H5N1 人际传染性研究
  • 5.1 大流感基因序列特征
  • 5.2 H5N1 的人际传染性
  • 5.3 大流感病毒形成机制预测
  • 5.4 本章小结
  • 第六章 总结和展望
  • 6.1 本文研究总结
  • 6.1.1 元胞自动机在 H5N1-H5 基因序列特征提取中的应用
  • 6.1.2 H5N1-H5 三维结构的重建
  • 6.1.3 分子对接在分子水平上研究 H5N1 高致病机理中的应用
  • 6.1.4 H5N1 高致病进化规律分析及预测
  • 6.1.5 大流感基因序列特征的提取及大流感预测
  • 6.2 课题研究展望
  • 6.2.1 生物实验的验证
  • 6.2.2 H5N1 血凝素蛋白切割位点与其它蛋白酶的相互作用
  • H5N1-H5 序列信息列表(附录一)
  • 参考文献
  • 致谢
  • 攻读博士期间以第一作者完成的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

    基于生物信息学的禽流感H5N1病毒高致病性和传染性的研究
    下载Doc文档

    猜你喜欢