基于主成分分析和神经网络的蛋白质糖基化位点的预测

基于主成分分析和神经网络的蛋白质糖基化位点的预测

论文摘要

随着计算机科学和生物科学的不断发展,生物信息学这门学科已成为当下生命科学和自然科学的重大前沿领域之一,同时也是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学和蛋白组学两个方面。糖基化是蛋白质翻译后重要修饰过程之一,更是蛋白组学研究的重要内容。鉴于已知的糖蛋白结构十分有限,而新的糖蛋白结构层出不穷,借助计算智能技术对糖基化位点进行预测和分析在蛋白质组学中具有十分重要的意义。主成分分析(PCA)是一种数据特征提取技术,它能将数据从高维降到低维,降维后保存了数据的主要信息,从而使数据更容易处理,且提高了分析效率传统的神经网络方法已被应用预测蛋白质糖基化位点,其预测的准确性主要依赖于特征向量的维数(蛋白质序列的长度),并随着蛋白质序列长度的增加而提高,但神经网络的结构变得越来越复杂,增加了计算运行成本。为了解决这一问题,本研究提出了一个主成分分析和BP神经网络相结合的新方法对O-连接糖基化位点进行预测和分析。首先用PCA提取主成分以降低输入特征向量的维数,然后用神经网络预测一个特定的蛋白质序列是否被糖基化。本研究主要围绕以下几个方面进行开展:(1)首先从阐述蛋白质糖基化的知识入手,着重介绍了稀疏编码,并将其作为本研究中蛋白质序列的编码方式。(2)采用主成分分析技术完成数据的预处理,在充分利用原始信息的基础上,将样本数据从高维降到低维,从而使神经网络在下一步的预测中更具效率。(3)提出一种基于PCA和BP神经网络的蛋白质O-糖基化位点预测的算法,对此算法进行了详细的分析和设计。为了更好的验证这种算法的有效性,本研究方法与传统BP算法的实验结果进行了对比。实验表明,采用了本研究提出的新方法具有以下优点(1)网络的收敛速度明显加快,大大的降低了运算时间;(2)糖基化位点的预测的准确性明显提高,说明结合了主成分分析技术的BP神经网络在蛋白质糖基化位点的预测方面具有很大的优势。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景与意义
  • 1.2 研究现状和进展
  • 1.3 本研究的主要内容
  • 1.4 章节内容安排
  • 2 蛋白质糖基化的理论基础
  • 2.1 糖基化的定义
  • 2.2 糖基化的类型
  • 2.3 蛋白质序列的编码方式
  • 2.3.1 稀疏编码
  • 2.3.2 基于profile的编码
  • 2.3.3 5字母编码
  • 2.3.4 基于密码子的编码
  • 2.4 糖基化蛋白的鉴定方法
  • 2.5 本章小结
  • 3 主成分分析法
  • 3.1 引言
  • 3.2 主成分分析法的原理
  • 3.3 主成分分析法的实现步骤
  • 3.4 主成分个数的判定原则
  • 3.5 实例分析
  • 3.6 本章小结
  • 4 人工神经网络
  • 4.1 人工神经网络概述
  • 4.2 人工神经网络的发展
  • 4.3 人工神经网络模型
  • 4.4 神经网络的应用
  • 4.5 BP神经网络
  • 4.5.1 BP神经网络结构
  • 4.5.2 BP神经网络的局限性及改进算法
  • 4.5.3 Bp网络在预测领域的实现
  • 4.6 本章小结
  • 5 基于PCA和BP神经网络的糖基化位点的预测和分析
  • 5.1 引言
  • 5.2 数据源与编码
  • 5.3 PCA数据预处理
  • 5.4 BP神经网络的设计
  • 5.4.1 改进的优化算法
  • 5.4.2 关键指标设计
  • 5.4.3 网络性能测试
  • 5.5 基于PCA和BP神经网络的预测模型
  • 5.6 实验结果与分析
  • 5.6.1 实验结果
  • 5.6.2 分析及结论
  • 5.7 本章小结
  • 6 总结与展望
  • 参考文献
  • 附录:攻读学位期间的主要学术成果
  • 致谢
  • 相关论文文献

    • [1].基于优化神经网络的地质灾害监测预警仿真[J]. 计算机仿真 2019(11)
    • [2].基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J]. 轻工机械 2019(06)
    • [3].时频联合长时循环神经网络[J]. 计算机研究与发展 2019(12)
    • [4].几种典型卷积神经网络的权重分析与研究[J]. 青岛大学学报(自然科学版) 2019(04)
    • [5].基于GA-BP神经网络异纤分拣机检测参数优化[J]. 棉纺织技术 2020(01)
    • [6].基于集成神经网络的织物主观风格预测研究[J]. 纺织科技进展 2020(01)
    • [7].试析神经网络技术在机械工程中的应用及发展[J]. 网络安全技术与应用 2020(02)
    • [8].一种深度小波过程神经网络及在时变信号分类中的应用[J]. 软件 2020(02)
    • [9].不同结构深度神经网络的时间域航空电磁数据成像性能分析[J]. 世界地质 2020(01)
    • [10].基于深度神经网络的航班保障时间预测研究[J]. 系统仿真学报 2020(04)
    • [11].基于生成对抗网络和深度神经网络的武器系统效能评估[J]. 计算机应用与软件 2020(02)
    • [12].基于循环神经网络的双轴打捆机智能换挡策略研究[J]. 安徽工程大学学报 2020(01)
    • [13].基于图神经网络的实体对齐研究综述[J]. 现代计算机 2020(09)
    • [14].基于改进的循环神经网络深度学习跌倒检测算法[J]. 电脑编程技巧与维护 2020(03)
    • [15].神经网络探索物理问题[J]. 物理 2020(03)
    • [16].基于GA-BP神经网络的城市用水量预测[J]. 现代电子技术 2020(08)
    • [17].基于深度神经网络的药物蛋白虚拟筛选[J]. 软件工程 2020(05)
    • [18].基于轻量级神经网络的人群计数模型设计[J]. 无线电工程 2020(06)
    • [19].高效深度神经网络综述[J]. 电信科学 2020(04)
    • [20].含磁场耦合忆阻神经网络放电行为研究[J]. 广西师范大学学报(自然科学版) 2020(03)
    • [21].基于神经网络及特征运算的老年人平衡能力分析[J]. 重庆工商大学学报(自然科学版) 2020(04)
    • [22].神经网络技术在机械工程中的应用及发展探析[J]. 科技创新与应用 2020(18)
    • [23].基于竞争神经网络的变电站巡视周期分类[J]. 科技创新与应用 2020(18)
    • [24].基于双向循环神经网络的语音识别算法[J]. 电脑知识与技术 2020(10)
    • [25].结合相似日与改进神经网络的短期光伏发电预测[J]. 广西电业 2020(04)
    • [26].基于神经网络的流感大数据分析[J]. 中华医学图书情报杂志 2020(03)
    • [27].长短时记忆神经网络在地电场数据处理中的应用[J]. 地球物理学报 2020(08)
    • [28].基于门控循环单元神经网络的公交到站时间预测[J]. 南通大学学报(自然科学版) 2020(02)
    • [29].鼠脑神经网络的同步辐射3D成像研究[J]. 核技术 2020(07)
    • [30].基于长短记忆神经网络的短期光伏发电预测技术研究[J]. 华北电力大学学报(自然科学版) 2020(04)

    标签:;  ;  ;  ;  

    基于主成分分析和神经网络的蛋白质糖基化位点的预测
    下载Doc文档

    猜你喜欢