基于数据挖掘的癌症诊疗决策优化研究

基于数据挖掘的癌症诊疗决策优化研究

论文摘要

医疗水平是提高人民生存质量、保证人民健康,提高人均寿命的主要决定性因素。由于全球生态环境恶化及诊疗技术发展的相对滞后,癌症已经成为现代人类的最大杀手之一。医学是大量科学技术的成果的应用渠道和综合体现,医工(理)结合诊疗作为一个未来的发展趋势也得到了国内外广泛的关注,成为研究的热点。本文拟紧随医工(理)结合的时代脉搏,针对医疗界乃至全人类的迫切需求,发掘合作研究的契合点,针对癌症诊疗决策优化进行研究。考虑到癌症问题的复杂性与广泛性,本文主要以结直肠癌为例展开研究,以点带面地对癌症的诊断和治疗过程中所面临的决策关键点以及过程优化进行了深入探讨,通过大量研究实践体现医工(理)结合的意义与价值。本研究通过在医院采集的实际数据以及医学文献的数据作为数据挖掘的数据源,并且在医疗知识方面得到了中、美两国医学研究人员和临床医生的大力指导和帮助,以确保本研究的实际价值和真实可信。任何癌症的治愈都离不开正确的诊断和对症的治疗,因此,本研究对结直肠癌的诊断过程和治疗过程进行了全方位的优化研究。本文首先研究了结直肠癌多肿瘤标志物的多分割点设置问题。通过分析现有肿瘤标志物的使用状况和存在的问题,提出了为多个肿瘤标志物设置多个分割点的设想,以通过减少信息损失达到提高诊断正确率的效果。本文定制了基于遗传算法和粗糙集的多分割点设置算法,并应用于上海某三甲医院数据库中的肿瘤标志物检测。与医学诊断结果进行比较(串联法和并联法)后的结果显示,本研究提出的算法能够有效地将三个肿瘤标志物(CEA,CA199,CA50)的正常人——癌症病人的联合诊断正确率从78%提高至87%。通过与支持向量机、反馈式神经网络,最近邻法和决策树算法等现有算法相比较,表明本算法显著优于这些人工智能算法。其次,本文研究了结直肠癌肿瘤标志物组合优选问题。目前,医学界虽已普遍认同联合使用多肿瘤标志物具有提高诊断正确率的效果,但对于究竟采用哪几种肿瘤标志物的组合能达到最好的效果仍分歧较大。这种不确定度导致了选用组合时的主观性,使在数量以及肿瘤的选择上存在很大的差异,导致病人极有可能接受了多余或遗漏了必要的肿瘤标志物检测,因此必须加强肿瘤标志物的组合优化研究。本研究关注同步完成分割点设置与肿瘤标志物组合优选两种功能,致力于以最少的肿瘤标志物数目获得最高的诊断正确率。研究结果表明,在AFP,CEA,CA199,CA50和CA125五种肿瘤标志物中,最佳的肿瘤标志物组合是CEA和CA50,此举可将肿瘤标志物的诊断总成本下降56%;相比于医学串联法,本算法可成功地将良性——恶性病人的诊断正确率从67%提高至74%。再者,本文对癌症化疗计划进行了优化设计。由于化疗药物在杀死癌细胞的同时也会损害正常细胞,且其效果还受到人体抗药性的影响,这三个因素间所存在的平衡关系推动了化疗问题的优化研究。本研究根据最常用的最优控制模型的目标函数与限制条件,分析了既有研究的利弊,归纳总结出四个关键问题点。本研究发现马尔可夫决策过程(Markov Decision Process, MDP)模型可以解决或有效缓解这四个关键问题,在国内外首次提出了化疗计划优化的MDP模型。该模型通过在原有最优控制模型的基础上引入抗药性参数,并且赋予抗药性概率转移矩阵,用于对应MDP模型中5大元素之一的概率参数Pt ((?) s,a)。最终以研究案例的形式进行了相关计算,获得了一些富有启发意义的化疗意见和建议。最后,本文还进行了II期结肠癌病人的术后辅助化疗的成本效益分析。医学界目前公认III期结肠癌病人需接受术后辅助化疗,但对于II期病人是否应该接受该治疗仍有较大争议。本研究首次采用了基于马尔可夫过程模型的成本效益分析法(cost-effectiveness analysis)研究了术后辅助化疗对于II期结肠癌病人的使用前景。借用工程学科注重严谨性和精确性的研究方法,为术后辅助化疗首次建立了治疗期和随访期两个模型,并且在对现有医学文献进行了大范围筛选的基础上,从中挖掘出适用的数据,对于少部分无法获得的数据,本研究通过使用数据矫准(Calibration)算法予以获得,从而保证了研究结果的可行性和有效性。研究结果表明,对于小于或等于65岁的II期结肠癌病人实施术后辅助化疗是符合成本效益的。本研究使医学诊疗从定性向定量转变跨出了坚实的一步,部分研究成果已经在临床诊疗中得到认可和应用,在提高诊疗效果的同时,也具有极大的经济价值和社会价值。本研究虽以结直肠癌的诊疗为例,但研究成果不仅可应用于结直肠癌的诊疗,而且可为其它癌症的诊疗提供重要的方法学的参考和借鉴,对提高医疗服务质量具有重要的理论意义和实际应用价值。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 数据挖掘理论及其在医学上的应用
  • 1.2.1 数据挖掘理论简介
  • 1.2.2 数据挖掘在疾病辅助诊断中的应用
  • 1.2.3 数据挖掘在疾病预警、预测和预后分析中的应用
  • 1.2.4 数据挖掘在疾病治疗方案选择中的应用
  • 1.2.5 现有研究的不足与改进
  • 1.3 研究对象选择与描述
  • 1.3.1 结直肠癌简介
  • 1.3.2 结直肠癌的早期诊断
  • 1.3.3 结直肠癌的治疗
  • 1.4 研究内容和框架
  • 1.4.1 研究内容
  • 1.4.2 章节安排
  • 1.5 本章小结
  • 第二章 数据挖掘相关理论介绍
  • 2.1 引言
  • 2.2 数据挖掘——粗糙集理论
  • 2.2.1 粗糙集理论的基本概念
  • 2.2.2 决策表离散化
  • 2.2.3 粗糙集的决策表约简——值约简
  • 2.3 数据挖掘——马尔可夫理论介绍
  • 2.3.1 马尔可夫过程的基本概念
  • 2.3.2 马尔可夫过程模型的构造
  • 2.3.3 马尔可夫决策过程介绍
  • 2.4 基于马尔可夫过程建模的医疗成本效益分析
  • 2.4.1 成本效益分析——成本度量
  • 2.4.2 成本效益分析——效益度量
  • 2.5 本章小结
  • 第三章 结直肠癌多肿瘤标志物的多分割点设置
  • 3.1 引言
  • 3.2 研究思路与目标
  • 3.3 诊断正确率的评价方法
  • 3.4 基于遗传算法和粗糙集理论的多肿瘤标志物多分割点设置算法
  • 3.4.1 基于粗糙集的诊断正确率计算
  • 3.4.2 遗传算法流程
  • 3.4.3 算法总结
  • 3.5 实例应用
  • 3.5.1 数据来源
  • 3.5.2 多分割点设置算法与医学诊断方法的效果比较
  • 3.5.3 多分割点设置算法与常用人工智能算法的效果比较
  • 3.6 本章小结
  • 第四章 结直肠癌的肿瘤标志物优选
  • 4.1 引言
  • 4.2 研究思路
  • 4.3 算法相关支持技术
  • 4.3.1 基于信息熵的候选分割点确定原则
  • 4.3.2 二段式遗传算法
  • 4.3.3 基于案例推理(Case-based reasoning, CBR)的诊断
  • 4.3.4 算法流程框架图
  • 4.4 实例应用
  • 4.4.1 数据来源
  • 4.4.2 串并联法结果
  • 4.4.3 结直肠癌肿瘤标志物优选算法结果
  • 4.4.4 肿瘤标志物优选算法与逐步判别分析的效果比较
  • 4.4.5 肿瘤标志物优选算法与多分割点设置算法的效果比较
  • 4.5 本章小结
  • 第五章 癌症化疗计划的优化研究
  • 5.1 引言
  • 5.2 研究背景及思路
  • 5.3 典型模型简介
  • 5.3.1 最优控制模型
  • 5.3.2 最优控制模型数学表达
  • 5.4 现有研究概览
  • 5.4.1 解析法
  • 5.4.2 偏解析的近似法
  • 5.4.3 启发式算法
  • 5.5 研究思路
  • 5.6 化疗优化问题的MDP 模型设计
  • 5.6.1 MDP 模型的优势
  • 5.6.2 MDP 模型定义
  • 5.7 MDP 模型的案例研究
  • 5.7.1 案例介绍
  • 5.7.2 案例结果及分析
  • 5.8 本章小结
  • 第六章 II期结肠癌病人的术后辅助化疗(FOLFOX)成本效益分析
  • 6.1 引言
  • 6.2 研究思路
  • 6.3 马尔可夫过程模型建立
  • 6.3.1 辅助化疗阶段马尔可夫过程模型
  • 6.3.2 随访期马尔可夫过程模型
  • 6.4 模型的假设前提
  • 6.5 数据校准过程
  • 6.6 基本案例的参数
  • 6.6.1 概率数据
  • 6.6.2 成本数据
  • 6.6.3 效用数据
  • 6.7 敏感度分析
  • 6.8 结果
  • 6.9 讨论
  • 6.10 本章小结
  • 第七章总结与展望
  • 7.1 主要结论
  • 7.2 研究展望
  • 致谢
  • 参考文献
  • 攻读学位期间的研究成果
  • 附件
  • 相关论文文献

    • [1].自制多项目复合肿瘤标志物冻干质控品的稳定性评价[J]. 浙江检验医学 2009(04)
    • [2].肿瘤标志物临床应用的质量管理[J]. 浙江检验医学 2010(03)
    • [3].漫谈肿瘤标志物[J]. 江苏卫生保健 2020(04)
    • [4].2020年中国肿瘤标志物学术大会暨第十四届肿瘤标志物青年科学家论坛[J]. 医学信息 2020(20)
    • [5].防癌体检 莫陷误区[J]. 江苏卫生保健 2019(02)
    • [6].肿瘤标志物异常别惊慌[J]. 安全与健康 2018(06)
    • [7].肿瘤标志物高 勿恐慌[J]. 江苏卫生保健 2016(23)
    • [8].非小细胞肺癌患者EGFR突变和肿瘤标志物的相关性研究[J]. 医疗装备 2017(06)
    • [9].肿瘤标志物研究专题·栏目介绍[J]. 川北医学院学报 2017(05)
    • [10].肿瘤标志物与癌症有多大关联[J]. 江苏卫生保健 2016(05)
    • [11].子宫内膜癌相关肿瘤标志物的研究进展[J]. 医学综述 2016(09)
    • [12].2016肿瘤标志物应用规范与研究进展研讨会[J]. 实用检验医师杂志 2016(02)
    • [13].精准检测之肿瘤标志物研究进展[J]. 标记免疫分析与临床 2016(10)
    • [14].肿瘤标志物升高 莫拿提示当诊断[J]. 江苏卫生保健 2015(03)
    • [15].肿瘤标志物升高怎么办?[J]. 家庭生活指南 2020(03)
    • [16].肿瘤标志物升高,就是得癌了吗[J]. 幸福家庭 2020(07)
    • [17].肿瘤标志物的临床意义[J]. 开心老年 2018(04)
    • [18].肿瘤标志物,你该知道这些事儿[J]. 保健文汇 2019(02)
    • [19].肿瘤标志物,你该知道这些事儿[J]. 健康人生 2019(07)
    • [20].查出肿瘤标志物升高就一定是癌症吗[J]. 保健文汇 2019(07)
    • [21].肿瘤标志物升高不能断定患癌!有两类人需定期筛查![J]. 抗癌之窗 2019(03)
    • [22].教你看懂肿瘤标志物检查单[J]. 人人健康 2019(16)
    • [23].肿瘤标志物高是不是癌症的信号?[J]. 抗癌之窗 2019(05)
    • [24].体检发现肿瘤标志物异常怎么办?[J]. 健康人生 2017(02)
    • [25].肿瘤标志物超标不一定是患了癌症[J]. 解放军健康 2018(01)
    • [26].常用肿瘤标志物与应用误区[J]. 抗癌之窗 2017(01)
    • [27].肿瘤标志物=肿瘤吗?[J]. 抗癌之窗 2017(02)
    • [28].肿瘤标志物的组合及意义[J]. 养生大世界 2018(11)
    • [29].肺癌和乳腺癌患者血管内皮生长因子水平及其临床意义[J]. 人人健康 2016(20)
    • [30].关于肿瘤标志物的那些事[J]. 康颐 2016(05)

    标签:;  ;  ;  ;  ;  

    基于数据挖掘的癌症诊疗决策优化研究
    下载Doc文档

    猜你喜欢