基于神经网络的多类肿瘤亚型识别研究

基于神经网络的多类肿瘤亚型识别研究

论文摘要

基于基因表达谱建立具有有效预测性的肿瘤分类模型对肿瘤的临床诊断与治疗具有非常重要的意义。针对肿瘤亚型识别问题,所要解决的一个关键问题就是发现决定肿瘤亚型的一组特征基因子集。本文以急性淋巴性白血病(ALL)的七种亚型作为研究对象,从系统科学和信息科学的角度,采用人工智能和计算机技术,就急性淋巴性白血病的特征基因选取问题和亚型识别问题,基于基因表达数据进行了研究,取得如下研究成果:首先针对ALL亚型分类信息的分类权重的研究,本文采用Relief算法作为对ALL亚型进行特征基因选取的距离指标,用以剔除分类无关基因。考虑到ALL具有七个亚型,我们使用改进的ReliefF算法作为基因排序和选择的标准。其次针对ALL亚型预测模型的研究,本文分析了基于人工神经网络(ANN)的分类工具在急性淋巴性白血病肿瘤亚型识别中的应用。介绍了人工神经网络的特点及其在模式分类中的应用,同时我们设计了一个三层的BP网络模型,其隐含层节点数可以随着输入特征基因数的变化而变化。通过留一交叉检验与独立测试集评估,选取了一个包含169个基因的特征集合,以此作为BP网络模型的分类输入特征,获得了100%的分类准确率。最后针对ALL样本集中冗余基因过滤问题,提出一种基于基因表达谱聚类分析方法寻找癌症相关靶基因和共调控基因的方法,介绍了K-means聚类方法以研究特征基因集合的聚类性能,以及就所选特征基因集合与Eng-Juh Yeoh的研究成果进行了比较,还包括对所选基因功能的初步探讨。通过实验我们得到了维数更少的含有38个基因的特征基因集合。然后通过ANN预测模型重新评估了选取的特征集合的性能,证实了选取的38个基因为具有最小分类错误数的最佳分类特征子集,表明了所提出的信息基因选择方法对于多肿瘤亚型的识别问题研究是非常有效的。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究的背景
  • 1.1.1 生物信息学
  • 1.1.2 肿瘤基因疾病的诊断概述
  • 1.1.3 研究的意义
  • 1.2 基于基因表达谱的肿瘤识别研究概况
  • 1.2.1 肿瘤识别概述
  • 1.2.2 肿瘤样本分类器
  • 1.3 本文工作
  • 1.3.1 主要内容
  • 1.3.2 论文组织
  • 1.4 小结
  • 第2章 问题描述及数据来源
  • 2.1 基因表达谱概述
  • 2.1.1 基因芯片的基本概述
  • 2.1.2 基因表达水平的检测与基因诊断
  • 2.1.3 基因表达谱数据的获取与表示
  • 2.2 ALL 识别问题概述
  • 2.3 ALL 表达谱数据库的建立
  • 2.4 小结
  • 第3章 数据预处理与特征选择
  • 3.1 数据预处理
  • 3.1.1 数据噪声
  • 3.1.2 数据预处理
  • 3.2 特征基因的选取
  • 3.2.1 分类信息指标
  • 3.2.2 ALL 分类特征选择
  • 3.3 特征选取结果比较
  • 3.3.1 分类特征基因集合
  • 3.3.2 特征基因的分类性能
  • 3.4 小结
  • 第4章 预测模型的设计与评估
  • 4.1 神经网络分类
  • 4.2 基于BP 网络的预测模型
  • 4.2.1 BP 网络结构的设计
  • 4.2.2 学习算法与过程
  • 4.3 交叉检验与独立测试集评估
  • 4.4 小结
  • 第5章 冗余过滤与聚类分析
  • 5.1 冗余分析集合的确定
  • 5.2 强相关性冗余基因的过滤
  • 5.2.1 K-means 聚类分析
  • 5.2.2 实验结果分析
  • 5.3 结果比较与分析
  • 5.4 小结
  • 总结与展望
  • 参考文献
  • 致谢
  • 附录A 攻读硕士学位期间发表论文目录
  • 相关论文文献

    • [1].基因表达谱技术分析棒曲霉毒素肾细胞毒性的机制[J]. 现代食品科技 2017(06)
    • [2].基于高通量测序的数字基因表达谱技术研究进展[J]. 北方园艺 2015(10)
    • [3].基因表达谱技术:贵亦需有道[J]. 医学争鸣 2010(04)
    • [4].我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J]. 生物学教学 2014(09)
    • [5].基于加权极限学习机的肿瘤基因表达谱数据分类[J]. 东北大学学报(自然科学版) 2017(06)
    • [6].奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J]. 南方医科大学学报 2012(04)
    • [7].脂多糖活化巨噬细胞的数字基因表达谱分析[J]. 中国药理学与毒理学杂志 2013(06)
    • [8].肾阴虚证和肾阳虚证基因表达谱的比较研究[J]. 山西医科大学学报 2012(09)
    • [9].口腔鳞癌细胞外泌体分离鉴定及基因表达谱研究[J]. 中华肿瘤防治杂志 2018(19)
    • [10].原发性骨质疏松症肾阳虚证骨组织全基因表达谱研究[J]. 中国骨质疏松杂志 2017(07)
    • [11].结肠癌基因表达谱降噪算法研究[J]. 医学理论与实践 2015(14)
    • [12].黄芩素对白念珠菌基因表达谱的影响[J]. 第二军医大学学报 2010(07)
    • [13].气滞血瘀证大鼠舌部基因表达谱变化初探[J]. 中国比较医学杂志 2017(09)
    • [14].中医药对类风湿关节炎细胞凋亡及基因表达谱的影响[J]. 中华中医药杂志 2010(04)
    • [15].重金属胁迫下白骨壤数字基因表达谱分析[J]. 林业科学研究 2017(02)
    • [16].高温胁迫下坛紫菜的数字基因表达谱研究[J]. 海洋学报(中文版) 2014(06)
    • [17].基于流形学习的基因表达谱数据可视化[J]. 生物信息学 2009(01)
    • [18].鼻息肉基因芯片检测及基因表达谱的研究[J]. 临床耳鼻咽喉头颈外科杂志 2008(11)
    • [19].转化生长因子β对人肾小管上皮细胞全基因表达谱的影响及其生物信息学分析[J]. 临床肾脏病杂志 2019(06)
    • [20].溃疡性结肠炎患者结肠黏膜基因表达谱生物信息学分析[J]. 解放军医药杂志 2019(11)
    • [21].基因表达谱微阵列网络数据库在肿瘤研究中的应用[J]. 中国生物化学与分子生物学报 2016(03)
    • [22].识别乳腺癌固有成像表型:与基因表达谱相关的初步研究[J]. 国际医学放射学杂志 2014(05)
    • [23].2型糖尿病的基因表达谱分析[J]. 中国实用内科杂志 2012(07)
    • [24].正常-脑瘫双生子基因表达谱差异研究[J]. 辽宁中医杂志 2009(11)
    • [25].脂多糖诱导实验性急性水肿性胰腺炎演变为急性坏死性胰腺炎的基因表达谱变化[J]. 胃肠病学 2008(06)
    • [26].基因表达谱技术从消化道肿瘤基础研究到临床转化[J]. 世界华人消化杂志 2018(34)
    • [27].变应性鼻炎发病相关基因表达谱的生物信息学分析及作为药物筛选新方法的探索[J]. 临床耳鼻咽喉头颈外科杂志 2018(19)
    • [28].干旱胁迫下丹参数字基因表达谱分析[J]. 基因组学与应用生物学 2018(10)
    • [29].盐胁迫下旱地棉叶片数字化基因表达谱分析[J]. 江苏农业学报 2016(03)
    • [30].依硫磷酸调控人类基因表达谱的预测及生物信息学分析[J]. 中国实验血液学杂志 2011(03)

    标签:;  ;  ;  ;  ;  

    基于神经网络的多类肿瘤亚型识别研究
    下载Doc文档

    猜你喜欢