惩罚COX模型和弹性网技术在高维数据生存分析中的应用

惩罚COX模型和弹性网技术在高维数据生存分析中的应用

论文摘要

目的:利用DNA微阵列技术和蛋白质谱技术测出的基因或蛋白等高维生物数据对癌症病人进行生存预测已不能再利用传统Cox比例风险模型。本论文将探讨惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)用于高维数据生存分析的优劣,从而揭露死亡或其他结局发生的时间和生物数据之间的关系,为得到更精确的诊断及预后从而改进治疗提供合理的方法依据。方法:介绍惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)的基本原理。针对基因或蛋白生物信息数据的高维度、强相关、小样本的特点进行模拟研究,对Van’t Veer等学者乳腺癌研究数据集进行分析,考察这些模型的预测性能。采用R软件进行数据模拟及分析。结果:以R 2作为模型预测性能的评价标准,从模拟实验中我们得出各自变量相关程度一样时随着数据资料方差的增大,各种模型筛选出的自变量倾向于增多,模型评价指标结果R2也呈增大趋势,模型拟合也越好。且随着删失比例的增加,几种方法的预测效能都会降低,说明模型的预测能力会受到删失比例的影响。结论:L2-COX模型和L1-COX模型都是处理高维生存资料的方法,只是L2-COX模型没有降维作用,但是处理共线性的效能强。L1-COX模型主要用来对高维数据进行降维而处理共线性的功能稍弱。EN-COX模型同时汲取了L1和L2两种模型的优点,既能有效处理共线性又可以降维还同时改进了L1,是分析处理高维小样本生存资料的理想模型。

论文目录

  • 摘要
  • Abstract
  • 前言
  • 第一章 惩罚COX 模型和弹性网
  • 1.1 基因表达数据的cox 比例风险回归模型:
  • 1.2 L2 惩罚cox 模型
  • 1.2.1 岭回归的基本思想及原理
  • 1.2.2 L2 惩罚cox 模型
  • 1.2.3 调整参数λ的选择
  • 1.2.4 岭回归的算法
  • 1.3 L1 惩罚cox 模型
  • 1.3.1 LASSO 的基本思想及原理
  • 1.3.2 算法
  • 1.3.3 调整参数λ 的选择
  • 1.3.4 LASSO 的优势和局限性
  • 1.4 弹性网
  • 1.4.1 弹性网的基本思想
  • 1.4.2 NEN 模型修正为 EN 模型
  • 1.4.3 COX 背景下的 EN 模型
  • 1.4.4 弹性网的计算方法
  • 1.4.5 调整参数的选择
  • 1.4.6 弹性网的优势
  • 1.5 模型评价
  • 第二章 模拟研究及实例分析
  • 2.1 模拟研究
  • 2.1.1 模拟数据生成
  • 2.1.2 模拟数据分析
  • 2.1.3 模拟数据分析结果
  • 2.1.4 模拟结果分析
  • 2.2 实例分析
  • 2.3 小结
  • 第三章 讨论
  • 参考文献
  • 个人简历
  • 致谢
  • 相关论文文献

    • [1].基于弹性网—自回归模型的股票价格研究[J]. 广西质量监督导报 2020(10)
    • [2].基于变量选择事件的新弹性网方法[J]. 数学的实践与认识 2019(12)
    • [3].融合脑电特征的弹性网特征选择和分类[J]. 生物医学工程学杂志 2016(03)
    • [4].弹性网结构的流体动力学性状[J]. 渔业现代化 2014(06)
    • [5].弹性网回归在功能磁共振成像数据分析中的应用综述[J]. 临床医药文献电子杂志 2017(98)
    • [6].改进的弹性网模型在深度神经网络中的应用[J]. 计算机应用 2019(10)
    • [7].基于弹性网的多维信息可视化研究[J]. 系统仿真学报 2010(02)
    • [8].我国居民医疗负担及其影响因素分析——基于弹性网方法的实证研究[J]. 数学的实践与认识 2019(14)
    • [9].基于弹性网回归的水下目标无监督特征选择算法[J]. 数字海洋与水下攻防 2018(01)
    • [10].基于弹性网降维及花授粉算法优化BP神经网络的短期电力负荷预测[J]. 仪器仪表学报 2019(07)
    • [11].基于弹性网稀疏表示的芯片参数成品率估算方法[J]. 电子学报 2017(12)
    • [12].基于弹性网正则化Logistic回归的上市公司财务预警研究[J]. 产业与科技论坛 2020(13)
    • [13].基于弹性网非局部相似的稀疏表示降噪算法[J]. 中国科技信息 2020(20)
    • [14].基于弹性网和直方图相交的非负局部稀疏编码[J]. 计算机应用 2019(03)
    • [15].基于弹性网正则化的广义逆波束形成[J]. 仪器仪表学报 2015(05)
    • [16].基于最大边界准则的稀疏局部嵌入特征提取方法[J]. 计算机应用研究 2017(05)
    • [17].错在哪里[J]. 中学生数理化(高二版) 2008(Z1)
    • [18].运用牛顿第二定律解题时的四个注意[J]. 中学生数理化(高一版) 2009(09)
    • [19].基于时空Kriging方法的时空数据插值研究[J]. 自动化学报 2020(08)
    • [20].应用多维项目反应理论模型探索分数减法测验的维度识别[J]. 数学的实践与认识 2017(21)
    • [21].改进的强相关数据的变量选择方法[J]. 大学数学 2017(01)
    • [22].事件社交网中基于有向标签图及用户反馈的活动推荐方法[J]. 计算机应用 2020(02)
    • [23].三种统计分析方法在基因表达谱数据中的比较研究[J]. 实用预防医学 2018(02)
    • [24].基于弹性网稀疏编码的空间目标识别[J]. 航空学报 2013(05)
    • [25].WFEN的贝叶斯估计及在高维预测模型中的应用[J]. 计算机应用研究 2016(01)
    • [26].基于部队训练任务的数据中心建设[J]. 无线电工程 2020(07)
    • [27].主元分析中的稀疏性[J]. 电子学报 2012(12)
    • [28].基于弹性网模型的“中等收入陷阱”问题研究[J]. 调研世界 2018(08)
    • [29].基于非负弹性网稀疏编码算法的图像分类方法[J]. 计算机工程 2017(07)
    • [30].基于Katz增强归纳型矩阵补全的基因-疾病关联关系预测[J]. 计算机科学与探索 2019(07)

    标签:;  ;  ;  

    惩罚COX模型和弹性网技术在高维数据生存分析中的应用
    下载Doc文档

    猜你喜欢