基于SVM-RFE算法的癌症基因表达数据分析

基于SVM-RFE算法的癌症基因表达数据分析

论文摘要

随着科学技术的不断发展和进步,现代医疗水平也得到了飞速的发展,越来越多未知的领域变得清晰起来,但仍有一些领域我们还不能更深一层的了解,例如癌症领域研究。随着人类基因的不断发展,癌症研究也得到了一定的发展,但面对纷繁复杂的数据,如何从海量数据中寻找出我们需要的、有用的数据成为了医学上癌症领域研究的瓶颈。在这样的情况下,基因芯片技术的出现、特征选择方法的深入研究以及支持向量机、统计理论体系、数据挖掘技术的不断完善和发展,都为现代癌症研究提供了很好的技术支持。支持向量机(SVM)是一种新兴的、通用的机器学习方法,具有良好的泛化能力,能够较好地解决维数高、小样本、非线性等特点的问题。它是对统计学习理论的进一步发展,其核心思想,是使机器学习和样本训练相互适应。与以往不同的是,支持向量机采用的不再是经验风险最小化原则,而是选择结构风险最小化原则。这样使得SVM具有良好地小样本学习能力,同时也使得机器具有很好的推广能力。另外,SVM采用了核函数的思想,通过非线性问题转换,将实际问题对应于高维度空间,将非线性判别函数重新构造,转化成更高维空间中的线性判别函数,从而解决现实中难以解决的问题。论文主要研究的是应用SVM-RFE算法,对癌症基因表达数据进行分析研究。SVM-RFE是指将支持向量机(SVM)与递归特征筛选法(RFE)相结合的一种算法。SVM-RFE属于后向搜索算法,它通过选择消去不必要的特征,来降低空间的维数。本文使用SVM-RFE算法,对肿瘤基因表达谱数据进行分析,进而分析这种算法在医学海量数据的分析、研究上的优势及特点。本文将SVM-RFE算法运用到对于胃癌、胰腺癌和结肠癌的基因数据分析处理中。先用T-test方法对原始数据集进行初始处理,去掉无关信息,提炼基因信息;再用SVM-RFE算法对基因数据进行处理。实验结果表明,使用SVM-RFE特征选择算法的支持向量机,其预测准确率相对更高,敏感度也更好。同时,通过算法选出的特征基因也可以为疾病研究和临床诊断提供一定的参考。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论 1 1.1 研究背景
  • 1.1 研究背景
  • 1.2 生物信息学的发展
  • 1.3 基因芯片的产生与应用
  • 1.4 本文的主要工作内容
  • 第2章 支持向量机及相关理论
  • 2.1 相关理论
  • 2.1.1 数据挖掘
  • 2.1.2 机器学习
  • 2.1.3 统计学习理论
  • 2.2 支持向量机
  • 2.2.1 最优分类面(最优分类线)
  • 2.2.2 核函数(kernel)
  • 2.2.3 支持向量机的主要特点
  • 第3章 特征选择方法
  • 3.1 特征选择概述
  • 3.2 特征选择方法分类
  • 3.2.1 按照特征的评价标准分类
  • 3.2.2 按照搜索策略分类
  • 3.3 特征选择方法的影响因素
  • 3.4 SVM-RFE 方法
  • 3.4.1 算法概述
  • 3.4.2 算法流程
  • 3.4.3 算法的优势
  • 第4章 SVM-RFE 算法在癌症基因数据分析的应用
  • 4.1 实验数据来源
  • 4.2 实验过程概述
  • 4.3 T-test 方法
  • 4.4 实验结果及分析
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于阿尔茨海默病的基因表达数据改进的一维聚类方法[J]. 四川师范大学学报(自然科学版) 2015(04)
    • [2].多步骤决策树方法在基因表达数据上的应用研究[J]. 中国卫生统计 2017(01)
    • [3].基于大脑不同区域的阿尔茨海默症基因表达数据分析[J]. 上海交通大学学报 2013(06)
    • [4].癌症基因表达数据的熵度量分类方法[J]. 安徽大学学报(自然科学版) 2010(02)
    • [5].蛋白质网络和基因表达数据与癌症转移的预测[J]. 国际药学研究杂志 2008(02)
    • [6].基于遗传算法和学习向量化网络的基因表达数据的阈值分析[J]. 中国海洋大学学报(自然科学版) 2013(12)
    • [7].基于非负矩阵分解的大脑不同区域基因表达数据分析[J]. 中国生物医学工程学报 2012(06)
    • [8].浅谈模式识别中的支持向量机技术分析肿瘤基因表达数据[J]. 科技资讯 2011(33)
    • [9].两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类的比较研究[J]. 中国卫生统计 2009(05)
    • [10].基于层级规则树的跨平台基因表达数据分类[J]. 计算机工程 2019(07)
    • [11].基因表达数据横向荟萃分析方法综述[J]. 数理统计与管理 2018(02)
    • [12].基于矩阵分解技术的显著基因提取及基因表达数据分析[J]. 生物医学工程学杂志 2014(03)
    • [13].基因表达数据分析中的特征基因提取[J]. 微计算机信息 2008(09)
    • [14].免疫聚类算法在基因表达数据分析中的应用[J]. 北京邮电大学学报 2010(02)
    • [15].基因表达数据在数据库中的预处理[J]. 电脑知识与技术 2009(16)
    • [16].基于人工蜂群和SVM的基因表达数据分类[J]. 山东大学学报(工学版) 2018(03)
    • [17].基于稀疏极大边界特征的癌症基因表达数据分析[J]. 郑州师范教育 2012(04)
    • [18].基于DE-CStacking集成的基因表达数据分类算法[J]. 小型微型计算机系统 2019(08)
    • [19].从肿瘤基因表达数据挖掘分类规则的研究[J]. 中国生物医学工程学报 2009(05)
    • [20].微阵列基因表达数据的选择及方法[J]. 现代交际 2015(08)
    • [21].基于差异性和准确性的加权调和平均度量的基因表达数据选择性集成算法[J]. 计算机应用 2018(05)
    • [22].基因表达数据分类算法及应用探讨[J]. 洛阳理工学院学报(自然科学版) 2014(03)
    • [23].PSO和Cholesky分解的KELM的基因表达数据分类[J]. 中国计量学院学报 2016(02)
    • [24].基于压缩感知的癌症基因表达数据分类[J]. 中国计量学院学报 2012(01)
    • [25].应用于癌症基因表达数据的OMB双向聚类算法[J]. 计算机工程与应用 2011(28)
    • [26].从基因表达数据中挖掘最大的行常量双聚类[J]. 计算机应用研究 2011(12)
    • [27].小波包分解和模糊聚类下的基因表达数据分析[J]. 计算机工程与应用 2009(19)
    • [28].基于肿瘤基因表达数据的简单有效的基因选择算法(英文)[J]. 中国科学技术大学学报 2009(08)
    • [29].基于基因表达数据的双聚类分析研究[J]. 河南科技 2018(34)
    • [30].基因表达数据中的局部模式挖掘研究综述[J]. 计算机研究与发展 2018(11)

    标签:;  ;  ;  ;  ;  

    基于SVM-RFE算法的癌症基因表达数据分析
    下载Doc文档

    猜你喜欢