基于SVM的跨膜蛋白结构预测应用研究

基于SVM的跨膜蛋白结构预测应用研究

论文摘要

膜蛋白是一种具有重要生物功能的蛋白质,在生物体中发挥着极其重要的作用。尽管磷脂双分子层构成了生物膜的基本框架,然而膜蛋白却始终是膜功能的主要体现者,是细胞执行各种功能的物质基础。根据蛋白质的序列信息预测是否属于β桶状跨膜蛋白、是否属于α螺旋跨膜蛋白和是否属于内在膜蛋白等是跨膜蛋白3D结构预测和功能分析的重要先导步骤,也是蛋白质预测领域中的一个挑战性问题。本文就重点对跨膜蛋白结构预测进行研究。跨膜蛋白序列的特征提取是跨膜蛋白预测研究中最为基本的问题,也是决定分类预测质量的关键。本文从跨膜蛋白的一级序列出发,提出和实现了不同的特征提取算法,并且在所选择的数据集MCP1087上进行了10-叠交叉检验和比较分析。采用了融合氨基酸组成位置和物理化学特性的特征提取方法,利用支持向量机的分类算法构建了预测跨膜蛋白是否属于β桶状跨膜蛋白的模型、预测跨膜蛋白是否属于α螺旋跨膜蛋白的模型和预测跨膜蛋白是否属于内在膜蛋白的模型。在实验中,通过不同的探索,寻求更有效的特征提取方法。第一,以单一氨基酸残基指数计算残基指数相关系数,并根据单一氨基酸残基指数预测结果的优劣,选择不同的多个氨基酸残基指数的最优组合;第二,在氨基酸组分的基础上,加入氨基酸残基在蛋白质序列中的位置信息,更深层次地挖掘蛋白质序列中所蕴含的特征,避免了丢失蛋白质序列中氨基酸位置顺序的信息;第三,改变自相关函数的阶数,充分挖掘蛋白质序列中氨基酸残基的长程相关性信息,进一步提高模型的分类预测性能。本文中构建的三个分类预测模型在测试集上的分类精确度最高分别达到了88.36%、87.89%和94.41%,MCC相关系数分别为0.7723、0.7667和0.8907。本文详细的实验结果表明,基于SVM的跨膜蛋白结构预测能够为跨膜蛋白3D结构预测和功能分析提供有价值的支持。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 背景及意义
  • 1.3 本文的主要工作及创新
  • 1.4 本文的内容安排
  • 第二章 支持向量机
  • 2.1 SVM 的理论基础
  • 2.2 SVM 的基本思想
  • 2.2.1 线性可分的情况
  • 2.2.2 线性不可分的情况
  • 2.2.3 核函数
  • 2.3 SVM 方法的特点
  • 2.4 SVM 解决实际问题的基本步骤
  • 第三章 国内外研究现状及分类算法
  • 3.1 膜蛋白序列的特征提取算法
  • 3.1.1 基于氨基酸组成和位置的特征提取方法
  • 3.1.1.1 氨基酸组分(Amino Acid Composition: ACC)
  • 3.1.1.2 熵密度(Entropy Density Profile: EDP)
  • 3.1.1.3 残基耦联模型(Residue Couple Model: RCM)
  • 3.1.2 基于氨基酸物理和化学特性的特征提取方法
  • 3.1.2.1 自相关函数
  • 3.1.2.2 伪氨基酸组成(Pseudo Amino Acid Composition: PseAA)
  • 3.1.2.3 Zp 曲线和Zp 参数
  • 3.1.2.4 疏水模式组成(Hydrophobic Pattern: HP)
  • 3.1.2.5 类序列顺序作用(Quasi Sequence Order Effect: QSOE)
  • 3.1.3 基于数据库信息挖掘的特征提取方法
  • 3.2 膜蛋白分类算法
  • 3.2.1 基于机器学习的算法
  • 3.3 模型的构建
  • 3.3.1 数据集的构建
  • 3.3.2 模型的检验
  • 3.3.3 模型的评估
  • 第四章 跨膜蛋白预测
  • 4.1 β桶状跨膜蛋白预测
  • 4.1.1 引言
  • 4.1.2 数据和方法
  • 4.1.2.1 数据集
  • 4.1.2.2 SVM 的分类方法
  • 4.1.2.3 基于氨基酸组成位置和物理化学特性的特征
  • 4.1.3 结果与讨论
  • 4.1.3.1 检验标准
  • 4.1.3.2 结果
  • 4.1.4 结论
  • 4.2 α螺旋跨膜蛋白预测
  • 4.2.1 引言
  • 4.2.2 数据集
  • 4.2.3 方法
  • 4.2.3.1 SVM 分类方法
  • 4.2.3.2 基于氨基酸组成位置和物理化学特性的特征
  • 4.2.4 结果与讨论
  • 4.2.4.1 检验标准
  • 4.2.4.2 结果
  • 4.2.5 结论
  • 4.3 内在膜蛋白预测
  • 4.3.1 引言
  • 4.3.2 数据集
  • 4.3.3 方法
  • 4.3.3.1 SVM 分类方法
  • 4.3.3.2 特征提取
  • 4.3.3.2.1 基于氨基酸组分和氨基酸残基指数的特征
  • 4.3.3.2.2 基于位置权重的氨基酸组分和氨基酸残基指数的特征
  • 4.3.4 结果与讨论
  • 4.3.4.1 检验标准
  • 4.3.4.2 结果
  • 4.3.5 结论
  • 第五章 总结与展望
  • 5.1 工作总结
  • 5.2 工作展望
  • 参考文献
  • 攻读学位期间公开发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于SVM的永磁无刷直流电机无位置传感器控制[J]. 电子产品世界 2020(01)
    • [2].基于商空间的黄金价格SVM模型预测[J]. 黄金科学技术 2020(01)
    • [3].基于主成分降维的SVM回归模型在煤与瓦斯突出预测中的应用[J]. 工业计量 2020(01)
    • [4].基于SVM的在线医疗信息服务质量关键影响因素研究[J]. 情报科学 2020(03)
    • [5].基于SVM与fMRI技术对精神分裂症的分类研究[J]. 现代计算机 2020(01)
    • [6].基于SVM算法的微博评论数据情感分析[J]. 数字通信世界 2020(01)
    • [7].基于SVM的河道洪峰水位校正预报方法[J]. 水力发电 2020(04)
    • [8].基于SVM的煤与瓦斯突出预测模型及应用[J]. 陕西煤炭 2020(02)
    • [9].基于实时电价和加权灰色关联投影的SVM电力负荷预测[J]. 电网技术 2020(04)
    • [10].基于超声波扫描和SVM的综合管廊故障诊断模型[J]. 科技与创新 2020(07)
    • [11].基于SVM理论的航空发动机飞行数据可视化建模[J]. 科技创新与应用 2020(12)
    • [12].基于SVM的固化土无侧限抗压强度模型[J]. 宁波大学学报(理工版) 2020(04)
    • [13].基于遗传算法和SVM的肝豆状核变性震颤评估方法研究[J]. 西安文理学院学报(自然科学版) 2020(03)
    • [14].基于SVM的高速公路预防性养护效果评价模型及应用[J]. 工程建设 2020(05)
    • [15].基于因子分析和SVM的网络舆情危机预警研究[J]. 重庆工商大学学报(自然科学版) 2020(05)
    • [16].基于SVM的物联网大数据有效信息过滤挖掘[J]. 河南科技 2020(26)
    • [17].基于改进SVM算法的思政教育动态预警系统研究[J]. 微型电脑应用 2020(09)
    • [18].基于SVM技术调剖(驱)潜力预测[J]. 承德石油高等专科学校学报 2019(05)
    • [19].基于海量数据的不平衡SVM增量学习的钓鱼网站检测方法[J]. 电信工程技术与标准化 2016(12)
    • [20].结合主方向和SVM的人脸表情识别[J]. 廊坊师范学院学报(自然科学版) 2016(04)
    • [21].SVM算法支持下的耕地面积退化遥感监测——以昆明市呈贡区为例[J]. 安徽农业科学 2017(01)
    • [22].矿井突水水源的SVM识别方法[J]. 辽宁工程技术大学学报(自然科学版) 2017(01)
    • [23].基于SVM算法的移动智能终端安全等级分级模型[J]. 通信技术 2017(04)
    • [24].图像视觉显著性和改进型SVM在图像分割中的研究[J]. 通讯世界 2017(08)
    • [25].一种基于决策树的SVM算法[J]. 太原学院学报(自然科学版) 2017(01)
    • [26].基于多级SVM分类的语音情感识别算法[J]. 计算机应用研究 2017(06)
    • [27].基于模糊信息粒与SVM的道路交通状态波动分析[J]. 重庆交通大学学报(自然科学版) 2017(07)
    • [28].基于SVM的上证指数预测研究[J]. 软件导刊 2017(08)
    • [29].基于集成SVM的肺部肿瘤PET/CT三模态计算机辅助诊断方法[J]. 生物医学工程研究 2017(03)
    • [30].一种基于SVM的声源定位算法[J]. 计算机技术与发展 2017(09)

    标签:;  ;  ;  ;  ;  

    基于SVM的跨膜蛋白结构预测应用研究
    下载Doc文档

    猜你喜欢