Print

基于改进的BP神经网络对连续B细胞表位的预测

论文摘要

随着人类基因工程的高效进行,基因组测序数据快速的增加,产生了一门新兴交叉学科——生物信息学。在生物信息学中人们不可能对所有的生物学数据进行实验验证,为了能进行更加有效地实验,充分利用有限的实验资源,对这些生物数据进行分析、整理和有效地预测就显得十分的重要。B淋巴细胞是人体内十分重要的免疫细胞,其分化成熟于骨髓,进而在Th细胞辅助下,在外周的淋巴组织内与抗原特异性结合,进一步分化为浆细胞,从而分泌抗体,进行免疫活动。B细胞成熟的重要标志就是细胞膜表达了免疫球蛋白IgM、IgD和Igα/Igβ链构成的B细胞受体(BCR)。免疫球蛋白IgM、IgD能特异性的识别抗原,与抗原结合后,再通过电信号形式将信息传递给Igα/Igβ链,由Igα/Igβ链把信号传递到细胞内部,促使B细胞的进一步分化,实现免疫应答。B细胞只有识别抗原(antigen)之后,在抗原的刺激作用下,才能启动免疫应答,免疫作用得以发挥。由此可知,抗原在免疫系统中起着十分重要的作用。抗原是一段蛋白质片段,它在免疫应答中能够与免疫细胞受体结合,在免疫应答中起关键作用。通常将能与B淋巴细胞特异性结合的抗原,称为B细胞表位。由此可见对B细胞表位的预测是特别的重要。B细胞表位分为连续表位和不连续表位,对于不连续表位的预测需要确定抗原的空间三维结构,因此存在着很大的困难,目前国际上多数都是对连续B细胞表位进行理论筛选。为了对连续B细胞表位做出快速有效地初步理论筛选,提高鉴定实验的成功率,本文应用改进的BP神经网络进行连续B细胞表位理论预测研究,并最终建立了B细胞表位的预测模型,与国内外现有的同类预测模型相比,本模型具有更为优越的预测表现(AUC=0.723)。为了进一步验证模型的性能,本文应用建立的模型对环子孢子蛋白进行了预测,取得了更为满意的效果。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 1 生物信息学简介
  • 1.1 什么是生物信息学
  • 1.2 生物信息学的主要研究内容
  • 1.3 生物信息学中的预测问题
  • 2 B淋巴细胞
  • 2.1 免疫球蛋白简介
  • 2.2 B细胞的分化成熟
  • 2.3 B细胞抗原受体(BCR)
  • 2.3.1 胞膜免疫球蛋白(mIg)分子
  • 2.3.2 Igα(CD79a)/Igβ(CD79b)
  • 2.4 B细胞表位
  • 2.4.1 B细胞表位结构及特点
  • 2.4.2 B细胞表位的预测原理
  • 2.4.3 连续B细胞表位的预测方法
  • 2.4.4 不连续B细胞表位的预测方法
  • 2.5 小结
  • 3 BP(back-propagation)神经网络的理论模型
  • 3.1 BP(back-propagation)神经网络数学模型
  • 3.1.1 BP神经网络的结构
  • 3.1.2 BP神经网络的数学描述
  • 3.2 BP网络方法的相关说明
  • 3.3 模型的改进
  • 3.3.1 算法存在的缺陷
  • 3.3.2 模型改进
  • 3.4 预测模型的建立
  • 3.5 模型的执行过程
  • 4 预测结果与讨论
  • 4.1 数据样本的抽取和预处理
  • 4.2 模型评价指标
  • 4.3 结果与讨论
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/3adf12a37221df26a052050e.html