论文题目: 嗜热菌耐热性与蛋白质序列、结构和功能关系的生物信息学研究
论文类型: 博士论文
论文专业: 发酵工程
作者: 丁彦蕊
导师: 须文波
关键词: 数据库,古细菌类蛋白质,细菌类蛋白质,耐热性,支持向量机,贝叶斯,最近邻规则,氨基酰合成酶,系统发育分析,脂肪酶,同源建模法
文献来源: 江南大学
发表年度: 2005
论文摘要: 嗜热菌产生的耐热酶在研究酶进化、蛋白质耐热的分子机制及酶功能上限温度等方面具有极其重要的理论和应用价值。研究蛋白质的序列、结构和功能对嗜热菌耐热性的影响作用,不仅可以从理论角度描述蛋白质折叠和稳定背后的物理化学原理,而且对于设计新的能在高温下发挥作用的新型酶类提供理论依据。本文以NCBI COG数据库中所有的原核生物蛋白质组作为研究对象,利用生物信息学的方法和工具,从序列、结构和功能角度对蛋白质耐热性的影响因素作了系统地分析,确定了各种因素对蛋白质耐热性的影响作用,并利用同源建模法对提高常温酶耐热性的途径进行了探索,为实验生物学提高蛋白质耐热性提供了可靠的理论参考。首先以Perl语言为编程接口,MySQL为数据库平台,对NCBI COG数据库中的原核生物蛋白质组进行了分类、筛选,构建了原核生物蛋白质关系数据库。该数据库由“原核生物蛋白质序列数据集”,“原核生物蛋白质结构数据集”和“原核生物蛋白质功能数据集”构成。蛋白质一级结构是研究耐热性的基础。本文首次研究了二肽类型和含量与蛋白质耐热性的关系,并与氨基酸残基数目以及氨基酸组成的影响进行了比较。结果表明:古细菌类蛋白质中Lys,Arg,VK,KI,YK,IK,KV,KY和EV的含量以及细菌类蛋白质中Lys,Glu,Tyr,Phe,Val,Ile,KE,EE,EK,YE,VK,KV,KK,LK,EI,EV,RK,EF,KY,VE,KI,KG,EY,FK,KF,FE,KR,VY,MK,WK和WE的含量与耐热性成显著正相关关系,而古细菌类蛋白质中Asp,Thr,Gln,His,DA,AD,TD,DD,DT,HD,DH,DR和DG的含量以及细菌类蛋白质中Gln,Ala,His,Trp,Thr,Asp,WQ,AA,QA,MQ,AW,QW,QQ,RQ,QH,HQ,AD,AQ,WL,QL,HA和DA的含量与耐热性成显著负相关关系。研究得到的特征二肽不但影响着蛋白质的耐热性,而且影响作用比氨基酸残基数目和氨基酸组成大。为了进一步验证氨基酸组成和二肽组成对耐热性的影响作用大小,接下来比较了支持向量机,贝叶斯,K-最近邻规则三种分类方法对超高温蛋白质,高温蛋白质和常温蛋白质的分类效果,选择了支持向量机作为最适合蛋白质耐热性预测的机器学习方法。分别以氨基酸组成,二肽组成以及氨基酸组成+二肽组成为特征向量,对三类蛋白质进行了预测,局部预测率分别为82.43%,83.33%,84.20%。预测率不仅表明支持向量机是预测蛋白质耐热性的比较好的方法,同时证明了蛋白质一级结构决定耐热性的理论,并且证实了二肽组成对蛋白质耐热性的影响作用大于氨基酸组成的影响。
论文目录:
摘要
Abstract
第一章 绪论
1.1 生物信息学简述
1.1.1 生物信息学产生背景
1.1.2 生物信息学数据库
1.1.2.1 GenBank 数据库
1.1.2.2 Swiss-Prot 数据库
1.1.2.3 PDB 数据库
1.1.3 生物信息学的研究内容
1.1.4 生物信息学的研究方法
1.2 嗜热菌及其耐热机制的研究进展
1.2.1 嗜热菌简介
1.2.1.1 嗜热菌概述
1.2.1.2 嗜热菌应用
1.2.2 嗜热菌耐热性的研究进展
1.2.2.1 膜的耐热性研究
1.2.2.2 核酸的耐热性研究
1.2.2.3 蛋白质的耐热性研究
1.3 本论文的立题背景及主要研究内容
1.3.1 立题背景
1.3.2 主要研究内容
参考文献
第二章 原核生物蛋白质关系数据库的构建及基本特征分析
2.1 引言
2.2 材料与方法
2.2.1 数据源
2.2.2 方法
2.2.2.1 数据库平台
2.2.2.2 编程接口
2.2.2.3 GenBank 数据的分解
2.2.2.4 数据库结构的设计
2.2.2.5 数据写入数据库
2.2.2.6 蛋白质数据库的构建过程
2.3 结果与讨论
2.3.1 原核生物蛋白质序列数据集的基本特征
2.3.2 原核生物蛋白质结构数据集的基本特征
2.3.3 原核生物蛋白质功能数据集的基本特征
2.4 本章小结
参考文献
第三章 嗜热菌耐热性与蛋白质序列关系的研究*
3.1 引言
3.2 材料与方法
3.2.1 数据集
3.2.2 方法
3.2.2.1 氨基酸残基个数统计
3.2.2.2 氨基酸组成和二肽组成统计
3.3 结果与讨论
3.3.1 氨基酸残基个数与蛋白质耐热性的关系
3.3.2 氨基酸组成与蛋白质耐热性的关系
3.3.2.1 氨基酸含量归一化
3.3.2.2 20 种氨基酸含量与嗜热菌耐热性的关系
3.3.2.3 带电荷氨基酸、不带电荷极性氨基酸和疏水性氨基酸含量与嗜热菌耐热性的关系
3.3.3 二肽组成与嗜热菌耐热性的关系
3.3.3.1 各类蛋白质二肽含量与平均二肽含量的比较
3.3.3.2 特征二肽
3.4 本章小结
参考文献
第四章 基于氨基酸组成和二肽组成预测蛋白质耐热性的分类方法研究*
4.1 引言
4.2 材料与方法
4.2.1 数据集
4.2.2 方法
4.2.2.1 支持向量机理论
4.2.2.2 贝叶斯理论
4.2.2.3 K-最近邻规则理论
4.2.2.4 特征向量提取
4.2.2.5 分类系统检验
4.2.2.6 训练和预测过程
4.3 结果与讨论
4.3.1 三种分类算法最优参数的选取及分类效果的比较
4.3.2 基于氨基酸组成,二肽组成及氨基酸组成+二肽组成预测蛋白质耐热性
4.4 本章小结
参考文献
第五章 嗜热菌耐热性与蛋白质结构关系的研究
5.1 引言
5.2 材料与方法
5.2.1 数据集
5.2.2 二级结构特征
5.2.3 氢键
5.2.4 盐桥
5.2.5 溶剂接触表面积
5.2.6 紧密度
5.2.7 疏水性
5.2.8 空腔数目和体积
5.2.9 温度因子
5.3 结果与讨论
5.3.1 二级结构特征与蛋白质耐热性的关系
5.3.1.1 二级结构含量与耐热性的关系
5.3.1.2 二级结构长度与耐热性的关系
5.3.1.3 二级结构中氨基酸分布及显著性分析
5.3.2 氢键数目和类型与蛋白质耐热性的关系
5.3.3 盐桥数目和类型与蛋白质耐热性的关系
5.3.4 表面积、紧密度和疏水性与蛋白质耐热性的关系
5.3.5 空腔个数和体积与蛋白质耐热性的关系
5.3.6 温度因子与蛋白质耐热性的关系
5.4 本章小结
参考文献
第六章 基于功能的嗜热菌蛋白质耐热性的系统发育研究
6.1 引言
6.2 材料与方法
6.2.1 数据集
6.2.2 方法
6.2.2.1 序列多重比对
6.2.2.2 系统发育分析
6.3 结果与讨论
6.3.1 以氨基酰-tRNA 合成酶研究进化的可行性判断
6.3.2 古细菌氨基酰-tRNA 合成酶的系统发育分析
6.4 本章小结
参考文献
第七章 基于同源建模法提高蛋白质耐热性的初步研究
7.1 引言
7.2 材料与方法
7.2.1 脂肪酶
7.2 2 同源建模法提高蛋白质耐热性的过程
7.3 结果与讨论
7.3.1 常温脂肪酶1CVL 特性分析
7.3.1.1 氨基酸组成和二肽组成
7.3.1.2 三维结构特性
7.3.2 常温脂肪酶1CVL 耐热性提高过程
7.3.3 常温脂肪酶1CVL 与改造后的酶分子比较
7.3.3.1 常温脂肪酶1CVL 与改造后的酶分子比对
7.3.3.2 常温脂肪酶1CVL 与改造后的酶分子的三维结构比较
7.4 本章小结
参考文献
主要结论
论文创新点
致谢
攻读博士学位期间取得的学术成果
附录
发布时间: 2006-07-20
参考文献
- [1].高温噬菌体分子特征及热稳定麦芽糖基淀粉酶的性质[D]. 刘斌.福建农林大学2007
- [2].嗜热菌强化剩余污泥水解及短链脂肪酸积累规律研究[D]. 杨春雪.哈尔滨工业大学2015
- [3].福州温泉嗜热菌多样性及嗜热菌Geobacillus thermoglucosidasius低温适应的机制[D]. 贾宪波.福建农林大学2016
- [4].陆地热泉及深海热液沉积物生境中的嗜热菌多样性研究[D]. 张心齐.浙江大学2009
- [5].酿酒酵母耐热分子调控系统的构建与应用[D]. 刘月芹.天津大学2014
- [6].深海热液区嗜热菌噬菌体GVE2与宿主相互作用的分子机理研究[D]. 魏大海.厦门大学2008
相关论文
- [1].蜜蜂(Apis mellifera)ant基因和vha16基因的克隆及其功能预测的生物信息学研究[D]. 陈大福.浙江大学2004
- [2].α-淀粉酶性能与结构关系的生物信息学研究[D]. 张革新.江南大学2005
- [3].肽链中脯氨酸的生物信息学与分子动力学研究[D]. 汪明磊.江南大学2005
- [4].基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D]. 俞晓晶.中国科学院研究生院(上海生命科学研究院)2006
- [5].基因组水平生物信息学工具的开发和应用(从ReAS到WEGO)[D]. 叶葭.浙江大学2006
- [6].蛋白质翻译后修饰和细胞信号通路的生物信息学[D]. 薛宇.中国科学技术大学2006
- [7].基于密码子水平的生物信息学分析及进化研究[D]. 张文娟.复旦大学2006
- [8].海洋嗜热菌的筛选、热稳定脂肪酶性质及其热适应机理研究[D]. 李鹤宾.厦门大学2007
标签:数据库论文; 古细菌类蛋白质论文; 细菌类蛋白质论文; 耐热性论文; 支持向量机论文; 贝叶斯论文; 最近邻规则论文; 氨基酰合成酶论文; 系统发育分析论文; 脂肪酶论文; 同源建模法论文;