结合属性筛选的决策树分析及其在中医诊断中的应用

结合属性筛选的决策树分析及其在中医诊断中的应用

论文摘要

传统中医学作为世界医学的一个宝库,两千多年来为中国及世界人民健康做出了不可磨灭的贡献,但是由于传统中医诊断学体系具有很多的不确定性、模糊性的内容,严重阻碍了中医的普及、推广和发展,如何将充满模糊性的中医辨证过程进行规范化和客观化是本文研究的主要问题。本课题通过应用基于属性筛选的决策树分析技术,从中医肝硬化病例数据中发现症状与证候之间的规律并提取出相应的辨证规则,作为一种辅助工具供给医务工作者参考,为实现中医诊断的数字化和客观化提供了一条途径。属性筛选作为一项重要的数据预处理技术,主要目的是识别和消除样本的属性集中与预测结果不相关的或冗余的属性。对于中医病例数据样本,由于采集数据代价较高,因此中医数据分类是典型的小样本分类问题。而且中医病例数据的维数相对来说较大,导致数据中的冗余和无关部分也会相应的增多。为得到更准确的辨证结果和辨证规则,在辨证前对数据进行属性筛选十分必要。中医辨证的本质是证候分类。现有的分类方法很多,其中决策树算法是一种以实例为基础的归纳学习算法。它具有易于提取显式规则、适合处理非数值型数据、可以显示重要的决策属性和较高的分类准确率等优点,从而成为辨证模型构建及辨证规则提取的有效工具。本文将围绕特征属性筛选算法和决策树分类模型进行研究,通过学习和总结前人的研究成果,提出一种结合属性筛选的决策树分析方法,并应用于中医肝硬化的辨证,旨在提供一种中医客观化诊断的新途径。本文主要工作包括以下方面:首先,对属性筛选算法进行研究,分析了属性筛选的主要目的和过程,以及基于相关度信息为评价依据的属性搜索方式和属性组合评价策略,提出了一种自适应属性筛选算法A-FCBF(Adaptive Fast Correlation-Based Filter),该算法通过对不同筛选阀值所对应的筛选结果进行属性组合优劣性评定,能够自适应的找出最优筛选阀值与特征属性子集,降低了由于人为干预所可能引入的误差,提升了数据约简过程的操作性和准确性。其次,对常用决策树算法的优缺点进行了总结,并从数据约简、决策属性选择和预剪枝策略等方面对传统算法进行了改进,提出了E-ID3(Enhanced Iterative Dichotomiser 3)决策树算法。以该算法进行决策树建模,首先将对原始训练数据进行特征属性约简;其次以相关信息增益度CIG(Correlated Information Gain)作为评估标准选定决策树各节点的分裂属性;在决策树的构建过程中,一旦树节点满足预剪枝标准,则停止对该节点继续分裂,并令该节点成为叶子节点。与传统算法相比,新算法提高了执行效率、预测精度,以及分类规则可理解性。最后,将本文提出的分析算法应用到中医肝硬化证候辨证问题上,通过总结清晰的辨证规则为中医客观化诊断提供参考依据,同时为中医智能化辨证提供了一条可行性途径。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 论文研究背景
  • 1.2 研究目的及技术路线
  • 1.3 相关技术简介
  • 1.3.1 特征属性筛选技术
  • 1.3.2 决策树分析技术
  • 1.4 论文组织结构
  • 1.5 本章小结
  • 第二章 数据预处理过程
  • 2.1 数据分类
  • 2.2 实际数据可能存在的问题
  • 2.3 数据预处理的主要任务
  • 2.3.1 数据清洗
  • 2.3.2 数据集成
  • 2.3.3 数据转化
  • 2.3.4 数据分割
  • 2.4 实验数据的获得与处理
  • 2.4.1 中医数据样本集
  • 2.4.2 标准数据样本集
  • 2.5 本章小结
  • 第三章 基于相关度信息的自适应属性筛选算法
  • 3.1 属性筛选的概念
  • 3.2 属性筛选的过程
  • 3.2.1 确定搜索模式
  • 3.2.2 搜索停止条件
  • 3.2.3 属性搜索策略
  • 3.2.4 属性筛选模型
  • 3.3 基于相关度信息的属性筛选算法
  • 3.3.1 属性间相关度的衡量方式
  • 3.3.2 基于属性相关度信息的属性搜索方法
  • 3.3.3 对属性组合的优劣性评定
  • 3.3.4 自适应特征属性筛选器
  • 3.4 实验分析
  • 3.4.1 特征属性筛选率
  • 3.4.2 对数据挖掘算法的积极作用
  • 3.5 本章小结
  • 第四章 结合属性筛选过程的决策树分析
  • 4.1 决策树算法的基本理论
  • 4.2 决策树模型的建模过程
  • 4.2.1 决策树的生成过程
  • 4.2.2 决策属性的选取标准
  • 4.3 几种经典的决策树算法
  • 4.3.1 ID3 算法
  • 4.3.2 C4.5 算法
  • 4.3.3 PUBLIC 算法
  • 4.4 结合属性筛选过程的E-ID3 决策树分析
  • 4.4.1 传统ID3 算法存在的不足
  • 4.4.2 对ID3 算法的改进与优化
  • 4.4.3 结合属性筛选器的决策树模型
  • 4.5 E-ID3 算法的性能分析
  • 4.5.1 实验数据
  • 4.5.2 实验分析
  • 4.6 本章小结
  • 第五章 结合属性筛选的决策树分析在中医诊断中的应用
  • 5.1 应用背景介绍
  • 5.2 病例数据的获取及预处理
  • 5.3 E-ID3 算法在肝硬化证候辨证上的应用
  • 5.3.1 各症状体征属性的重要性评价
  • 5.3.2 对病理症状体征属性进行筛选
  • 5.3.3 基于E-ID3 决策树模型提取的辨证规则
  • 5.3.4 辨证规则的有效性验证
  • 5.4 本章小结
  • 第六章 全文总结
  • 6.1 主要结论
  • 6.2 研究展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间已发表或录用的论文
  • 相关论文文献

    • [1].关于资产管理公司业务决策流程优化的思考——引入决策树分析模型[J]. 中国商论 2016(29)
    • [2].不同级别医疗机构孕产妇就医行为的决策树分析研究[J]. 中国全科医学 2018(17)
    • [3].概率发生时点不确定情况下的决策树分析[J]. 现代经济(现代物业下半月刊) 2009(05)
    • [4].护理工作量的决策树分析在护理质量综合评价中的应用[J]. 护理管理杂志 2014(02)
    • [5].基于三期决策树分析平台建立护理质量综合评价体系[J]. 护理研究 2016(07)
    • [6].判别分析与决策树分析在化学物质生态危害分类中的应用[J]. 生态与农村环境学报 2009(01)
    • [7].基于循证与决策树分析的医疗设备配置评估研究[J]. 中国医学装备 2018(02)
    • [8].基于决策树分析平台的病区护理单元绩效评价体系建设[J]. 齐鲁护理杂志 2018(05)
    • [9].决策树分析技术在桥梁施工期的风险评估研究[J]. 中外公路 2019(03)
    • [10].“北漂”青年的离京意愿及其影响因素——基于“2015年北京市青年人口发展状况调查”及东京圈人口变迁的分析[J]. 中国青年研究 2019(06)
    • [11].留置D-J管患者随访工作满意度影响因素的决策树分析[J]. 中国医学工程 2019(07)
    • [12].外科减重手术与药物治疗2型糖尿病伴肥胖患者的药物经济学评价[J]. 中国现代应用药学 2018(05)
    • [13].决策树分析在急性心肌梗死事件预测中的应用[J]. 浙江大学学报(医学版) 2019(06)
    • [14].关于南昌市社区“五全六能”楼/院式养老模式影响因素的决策树分析[J]. 南昌大学学报(医学版) 2019(02)
    • [15].2种抗菌药物治疗下呼吸道感染的决策树分析[J]. 中国医院药学杂志 2015(04)
    • [16].居民住院卫生服务利用影响因素决策树分析[J]. 中国公共卫生 2009(05)
    • [17].logistic回归结合决策树技术在冠心病患者住院费用组合分析中的应用[J]. 中国卫生统计 2015(06)
    • [18].决策树分析在高校大学生生活压力影响因素分析中的应用[J]. 卫生软科学 2013(02)
    • [19].失地农民被征地意愿影响因素的实证研究[J]. 统计与决策 2013(21)
    • [20].决策树和Design to Cost在纺织品开发中的应用[J]. 国际纺织导报 2010(03)
    • [21].腰椎间盘突出症2种手术方案的决策树分析[J]. 内蒙古中医药 2010(12)
    • [22].企业流动资金状况影响因素的决策树分析——基于重庆市规模以下服务业调查[J]. 调研世界 2016(12)
    • [23].投资项目风险分析模型制作——决策树分析与蒙特卡洛模拟的综合运用[J]. 会计之友(下旬刊) 2010(03)
    • [24].多囊卵巢综合征患者2种促排卵治疗方案的决策树分析[J]. 中国药房 2012(02)
    • [25].基于文本挖掘和决策树分析的中国手游产业发展研究[J]. 计算机科学 2020(S1)
    • [26].应用决策树分析影响高校学生就业的因素[J]. 科技创新导报 2009(31)
    • [27].可疑外汇交易的分类识别方法及其应用[J]. 西安交通大学学报(社会科学版) 2008(05)
    • [28].数据分析技术在社区矫正信息系统中的应用[J]. 计算机工程与应用 2017(20)
    • [29].头孢丙烯与头孢克洛治疗小儿上呼吸道感染的成本-效果分析[J]. 中国药物经济学 2014(07)
    • [30].车险赔付风险影响因素决策树分析[J]. 价值工程 2010(05)

    标签:;  ;  ;  

    结合属性筛选的决策树分析及其在中医诊断中的应用
    下载Doc文档

    猜你喜欢