蛋白质亚细胞定位的序列编码及预测方法研究

蛋白质亚细胞定位的序列编码及预测方法研究

论文摘要

人类基因组计划的顺利实施,为实现人类全体基因序列的确定奠定了基础,但是要想了解各种生命活动是如何完成的,必然要研究生命活动的执行体—蛋白质这一重要环节。另有生物学研究表明,蛋白质亚细胞定位与蛋白质功能是密切相关的,蛋白质亚细胞定位信息可以为蛋白质功能的研究提供有用的线索。因此为了进一步了解蛋白质的功能,识别蛋白质的亚细胞定位成为了蛋白质组学的一个重要研究方向。本文主要围绕蛋白质亚细胞定位预测这一主题,针对蛋白质序列的编码方法及分类预测算法等问题进行了深入研究,主要工作包括:1.本文提出了一种新的蛋白质序列编码方法,该方法根据氨基酸的物理化学性质将其分为六类,并为了获得各类氨基酸在蛋白质序列中的局部位置分布信息,而引入了平均分段的思想。然后采用支持向量机作为预测方法,在三个不同的凋亡蛋白数据集上进行测试,由实验结果可知,此方法获得了较好的预测效果。2.本文提出了一种基于疏水氨基酸及其他类氨基酸在蛋白质序列中的位置分布信息的伪氨基酸组成方法,然后基于蛋白质序列特征信息的多样性和差异性,构建了由多个支持向量机相组合的集成分类器。文中构建的集成分类器对多种不同的蛋白质序列特征信息进行组合,使得单个分类器的不确定性有所降低。将该方法分别在原核序列和真核序列数据集上进行测试,获得了较高的预测准确率,与其他方法相比,也具有明显的优势。

论文目录

  • 摘要
  • Abstract
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 引言
  • 1.2 研究背景及意义
  • 1.3 国内外研究现状
  • 1.4 论文主要内容及结构安排
  • 1.4.1 主要研究内容
  • 1.4.2 论文结构安排
  • 第2章 蛋白亚细胞定位预测的生物信息学方法
  • 2.1 蛋白亚细胞定位的生物学基础
  • 2.1.1 蛋白质简介
  • 2.1.2 生命中心法则
  • 2.1.3 细胞的基本构成
  • 2.2 数据集的建立
  • 2.3 蛋白质序列编码方法
  • 2.3.1 基于氨基酸组成的方法
  • 2.3.2 基于残基物理化学特性的编码
  • 2.3.3 基于功能域的序列编码
  • 2.3.4 基于GO注释的序列编码
  • 2.4 预测算法
  • 2.4.1 支持向量机
  • 2.4.2 离散增量
  • 2.4.3 多分类器组合
  • 2.5 预测性能评估
  • 2.6 小结
  • 第3章 基于局部位置分布信息的序列编码方法
  • 3.1 引言
  • 3.2 数据集
  • 3.3 蛋白质序列编码
  • 3.3.1 特征提取
  • 3.3.2 距离频率
  • 3.4 实验与分析
  • 3.4.1 各类氨基酸的距离频率分析
  • 3.4.2 分段数目对预测结果的影响
  • 3.4.3 预测结果的分析与比较
  • 3.5 小结
  • 第4章 基于多分类器组合的蛋白亚细胞定位预测方法
  • 4.1 引言
  • 4.2 材料与方法
  • 4.2.1 数据集
  • 4.2.2 蛋白质序列表示
  • 4.2.3 预测方法
  • 4.2.4 性能评估
  • 4.3 结果与讨论
  • 4.3.1 权重因子(weight factor)的选择
  • 4.3.2 序列编码方法的分析比较
  • 4.3.3 预测方法的分析比较
  • 4.4 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录A 攻读学位期间所发表的学术论文及所参加项目
  • 相关论文文献

    • [1].蛋白质序列与蛋白质结构关系的研究[J]. 河南教育学院学报(自然科学版) 2017(04)
    • [2].基于小波分析的蛋白质序列分形研究[J]. 科技信息 2009(33)
    • [3].基于数据挖掘的蛋白质序列分析研究[J]. 信息技术与信息化 2017(06)
    • [4].利用蛋白质序列模式识别改善谷氨酸棒杆菌基因组注释[J]. 工业微生物 2014(03)
    • [5].一种新的蛋白质序列二维图形表示方法及应用[J]. 绥化学院学报 2013(11)
    • [6].蛋白质序列基于k-字的数值刻画及应用[J]. 浙江农业学报 2014(06)
    • [7].蛋白质序列图形变换及其相似性聚类分析[J]. 生命科学研究 2018(03)
    • [8].粒计算理论下的进化树建模与应用探讨[J]. 白城师范学院学报 2019(10)
    • [9].蛋白质序列的矩阵图谱表达[J]. 生命科学研究 2011(02)
    • [10].对称蛋白质序列与结构关系研究[J]. 生命科学 2010(11)
    • [11].蛋白质序列的一类新的图形表示[J]. 黑龙江生态工程职业学院学报 2008(06)
    • [12].甲型流感病毒蛋白质序列的长记忆模型[J]. 江南大学学报(自然科学版) 2012(06)
    • [13].蛋白质序列的特征周期研究[J]. 生物物理学报 2008(02)
    • [14].基于功率谱的蛋白质序列特征提取新方法[J]. 食品与生物技术学报 2018(11)
    • [15].AI背景下蛋白质序列音乐研究[J]. 艺术教育 2019(06)
    • [16].基于矩阵图谱表达法的蛋白质序列的相似性分析[J]. 计算机工程与应用 2011(07)
    • [17].DNA和蛋白质序列数据分析工具(第三版)[J]. 新疆农业科学 2012(07)
    • [18].AI绘制蛋白质序列音乐流程及彩色二维谱[J]. 音乐生活 2020(11)
    • [19].甲型流感病毒HA蛋白质序列的预测[J]. 食品与生物技术学报 2013(08)
    • [20].P53基因蛋白质序列的相似性及其聚类分析[J]. 计算机与应用化学 2013(09)
    • [21].蛋白质序列在频率域上的一种特征提取方法[J]. 南京工业大学学报(自然科学版) 2013(06)
    • [22].基于加权决策树的蛋白质序列分类算法研究[J]. 计算机与数字工程 2012(05)
    • [23].蛋白质序列的图形表示及相似性分析[J]. 浙江农业学报 2010(05)
    • [24].一种新的蛋白质结构类预测方法[J]. 生物信息学 2012(04)
    • [25].荣昌猪SLA-DQB基因β1结构域突变分析及蛋白质序列模式预测[J]. 畜牧兽医学报 2012(08)
    • [26].基于TIGA_S4VM改进算法的蛋白质序列识别方法[J]. 山东大学学报(工学版) 2014(01)
    • [27].基于密码子特征的蛋白质序列图形表示[J]. 浙江理工大学学报(自然科学版) 2018(04)
    • [28].不同特征描述下H1N1病毒血凝素蛋白序列的比较分析[J]. 生命科学研究 2016(02)
    • [29].基于一种新的伪氨酸组成预测蛋白质折叠速率[J]. 大连交通大学学报 2015(03)
    • [30].基于极限学习机的蛋白质相互作用预测[J]. 枣庄学院学报 2017(05)

    标签:;  ;  ;  ;  ;  

    蛋白质亚细胞定位的序列编码及预测方法研究
    下载Doc文档

    猜你喜欢