论文摘要
目前,医生对疾病的诊断还处于传统的经验阶段,诊断结果的正误与医生的水平密切相关,特别是对于那些难以诊断的复杂病例,人们往往求助于医疗专家。但是专家的数量毕竟是有限的,尤其是对一些中小型医院来说,尚不具备在各个门诊处设立专家的条件,致使疑难病症的误诊率较高。因此利用先进的计算机知识结合医疗信息数据库,开发辅助诊断系统,已成为一个重要的发展方向。本文在研究数据挖掘中的决策树技术的基础上,引入了Boosting集成和改进主成分分析特征选择技术,充分考虑了诊断结果的可理解性,诊断模型的泛化能力、稳定性和准确度,提出了基于改进PCA特征选择和C4.5 Boosting集成技术的AD-BC4.5-PCAFS辅助诊断算法。该方法主要分为三个阶段:第一阶段是采用PCAFS进行特征选择,从而简化分类器的建立,降低冗余属性对分类器的影响;第二阶段是采用基于C4.5的Boosting集成技术建立多个分类模型;第三阶段是根据所训练出的模型对新样本的类别进行加权投票表决。本文的实验是在多个真实医疗数据集上进行的,结果表明:PCAFS特征选择方法完全正确,且比PEA特征压缩方法更高效、更易理解;AD-BC4.5-PCAFS辅助诊断算法比其他经典方法更高效。最后,本文将AD-BC4.5-PCAFS算法应用到与辅助诊断类似的导诊系统中,取得了良好的应用效果。
论文目录
相关论文文献
- [1].电子病历中可视化数据挖掘技术的应用[J]. 微计算机信息 2011(07)
- [2].基于RoughSet的医疗数据挖掘应用分析[J]. 湖北工业大学学报 2008(02)
- [3].基于Rough集的病历诊断分析[J]. 商丘师范学院学报 2010(09)
- [4].医学数据及其应用[J]. 中华医学图书情报杂志 2013(07)
- [5].BP神经网络在疾病分析影响因素中的作用(英文)[J]. 中国组织工程研究与临床康复 2011(09)