基于神经网络的蛋白质质谱数据在卵巢癌诊断中的应用研究

基于神经网络的蛋白质质谱数据在卵巢癌诊断中的应用研究

论文摘要

妇科疾病中,卵巢癌是常见癌症之一。卵巢癌在所有癌症中有着非常显著特点:前期症状不明显,不易发现。大多数患者发现癌症已经是晚期,并且死亡率极高。但是一旦早期发现卵巢癌,并加以相应的治疗,其死亡率很低。这就迫使人们寻找对卵巢癌早期诊断的方法。本文就是以质谱数据为基础,结合模式识别方法对卵巢癌进行模式分类研究。蛋白质组学是继基因组学之后又一大生命科学的研究热点,它在癌症检测、疾病病理等方面研究得到了学者们的重视。质谱理论和质谱数据的发展促进了蛋白质组学的发展,成为人们研究蛋白质组学的有力工具。遗传算法和神经网络是人们模拟生物繁殖、优胜劣汰和生物神经设计出的优化算法和模式识别方法,在特征提取和分类方面有着广泛得应用。本文是对蛋白质质谱数据预处理,用遗传算法进行特征提取、神经网络模式识别等做了一系列的研究。本文首先建立起了数据预处理过程,包括:数据加载、去噪、基线调整等。这样使得处理过的数据能够提供更加有效的分类信息。使用NCI-FDA建立起的表面增强激光解析电离飞行时间质谱数据库数据。数据经过预处理后,使用遗传算法进行特征提取与选择。本文选取了四个特征量为最显著特征。接下来利用可视化技术中的雷达图对数据进行表达,从中提取了特征三角形面积和雷达图周长两类五个特征。最后构建出神经网络,利用所有样本的五个特征对神经网络进行训练。训练完成之后随机挑选一组质谱数据对神经网络进行检测。我们发现神经网络对数据有很好的分类效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究的目的和意义
  • 1.2 卵巢癌简介
  • 1.2.1 卵巢癌
  • 1.2.2 几种常用卵巢癌早期诊断方法
  • 1.2.3 近年研究热点与卵巢癌早期诊断技术
  • 1.3 数据挖掘
  • 1.3.1 数据挖掘的概念
  • 1.3.2 数据挖掘的分类
  • 1.3.3 常用的数据挖掘技术
  • 1.4 可视化技术
  • 1.4.1 可视化的概念
  • 1.4.2 可视化技术的分类
  • 1.5 可视化数据挖掘
  • 1.5.1 可视化数据挖掘的技术方法
  • 1.5.2 可视化数据挖掘的重要性
  • 1.6 本文的研究内容及结构组织
  • 第2章 蛋白质组学及质谱理论与技术
  • 2.1 蛋白质组学简介
  • 2.2 蛋白质芯片
  • 2.3 质谱理论和质谱技术
  • 2.4 表面加强激光解析电离质谱技术
  • 2.4.1 SELDI-TOF-MS 技术基本原理与特点
  • 2.4.2 机理研究
  • 2.4.3 SELDI 蛋白质芯片技术的操作过程
  • 2.4.4 SELDI-TOF-MS 在癌症早期诊断中的应用
  • 2.5 本章小结
  • 第3章 质谱数据预处理及特征提取
  • 3.1 工具语言(PYTHON)
  • 3.1.1 python 的特点
  • 3.1.2 Python 的应用
  • 3.1.3 本课题使用的python 模块
  • 3.2 FDA-NCI 数据库简介
  • 3.3 数据前期处理
  • 3.3.1 数据的载入
  • 3.3.2 降噪
  • 3.3.3 基线校正
  • 3.3.4 标准化
  • 3.4 遗传算法进行特征提取的设计
  • 3.4.1 遗传算法(Genetic Algorithm,GA)
  • 3.4.2 遗传算法过程
  • 3.4.3 遗传算法特点
  • 3.4.4 遗传算法进行特征提取设计
  • 3.5 本章小结
  • 第4章 基于神经网络的蛋白质质谱数据在卵巢癌诊断的应用研究
  • 4.1 模式分类
  • 4.1.1 人工神经网络的结构
  • 4.1.2 神经网络的反向传播算法(BP)
  • 4.2 可视化质谱数据分类原理
  • 4.2.1 三角形面积特征提取
  • 4.2.2 雷达图总周长特征提取
  • 4.3 基于神经网络的可视化质谱数据分类
  • 4.3.1 神经网络构造
  • 4.3.2 实验结果
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间承担的科研任务与主要成果
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].蛋白质组学中质谱数据标准研究进展[J]. 质谱学报 2011(03)
    • [2].基于T检验与支持向量机的蛋白质质谱数据分析[J]. 淮阴师范学院学报(自然科学版) 2011(05)
    • [3].混合谱图所引发的肽段质谱数据分析的问题及其解决方案[J]. 生命的化学 2017(01)
    • [4].基于聚类分析和半监督学习的蛋白质质谱数据分类[J]. 航天医学与医学工程 2014(05)
    • [5].化学计量学方法用于蛋白质组学质谱数据的特征筛选[J]. 分析试验室 2012(10)
    • [6].基于遗传算法的蛋白质质谱数据特征选择[J]. 计算机工程 2009(19)
    • [7].质谱数据库法快速筛查壮阳类中成药和保健品中12种非法添加化学成分[J]. 理化检验(化学分册) 2018(08)
    • [8].基于稀疏表示算法的蛋白质质谱数据特征选择[J]. 生物物理学报 2012(08)
    • [9].基于模拟退火算法的高分辨率蛋白质质谱数据特征选择[J]. 生物信息学 2009(02)
    • [10].基于二维最大重叠离散小波变换的代谢组质谱数据的预处理方法[J]. 中国卫生统计 2017(06)
    • [11].基于质谱数据的肿瘤诊断WEB平台[J]. 计算机系统应用 2013(03)
    • [12].利用Mascot程序与家蚕EST数据对质谱数据进行鉴定[J]. 中国农业科学 2010(12)
    • [13].基于SVM的蛋白质质谱高通量分析方法研究[J]. 黑龙江科技信息 2015(13)
    • [14].基于QPSO-SVM算法的SELDI-TOF质谱数据分析[J]. 计算机应用与软件 2011(01)
    • [15].中药分析中质谱数据的可视化分析技术及其应用[J]. 中华中医药学刊 2017(12)
    • [16].基于Backfolding的纯净质谱数据提取算法[J]. 真空科学与技术学报 2013(01)
    • [17].质谱数据的特征降维新方法[J]. 小型微型计算机系统 2009(05)
    • [18].基于可视化图形特征融合的蛋白质组学质谱数据分析[J]. 燕山大学学报 2008(05)
    • [19].蛋白质组数据模式可视化分析[J]. 微计算机信息 2009(36)
    • [20].一种二次投影识别蛋白质谱数据的新方法[J]. 中山大学学报(自然科学版) 2009(06)
    • [21].撤回声明[J]. 肿瘤防治研究 2019(08)
    • [22].应用于Bottom-up蛋白质鉴定的质谱数据采集策略研究进展[J]. 分析化学 2013(07)
    • [23].基于ACO-SVM的质谱数据分析[J]. 计算机工程 2010(04)
    • [24].多元校正结合质谱数据进行四种有机物快速含量分析研究[J]. 光谱学与光谱分析 2016(02)
    • [25].开启质谱检测新未来[J]. Chinese Journal of Natural Medicines 2014(11)
    • [26].偏最小二乘判别分析结合F-score用于蛋白质组学质谱数据的特征筛选(英文)[J]. 计算机与应用化学 2012(12)
    • [27].安捷伦科技为受监管制药实验室推出安全信息解决方案[J]. 办公自动化 2014(13)
    • [28].基于数据非依赖采集的无色谱数据处理软件系统[J]. 北京生物医学工程 2020(01)
    • [29].沙门菌MALDI-TOF-MS标准菌库的建立及应用研究[J]. 卫生研究 2014(01)
    • [30].反向传播神经网络的蛋白质质谱高通量分析方法研究(英文)[J]. 计算机与应用化学 2014(10)

    标签:;  ;  ;  ;  ;  

    基于神经网络的蛋白质质谱数据在卵巢癌诊断中的应用研究
    下载Doc文档

    猜你喜欢