论文摘要
近年来,计算机辅助诊断(Computer Aided Diagnosis,CAD)逐渐成为医学领域的研究热点之一,很多计算机辅助诊断技术不断出现并获得快速发展,对于提高临床医生诊断的准确率、减少漏诊起到了积极的作用。数据挖掘技术的兴起和发展为计算机辅助诊断的发展提供了更广阔的空间。本文就基于数据挖掘的计算机辅助诊断在检验医学中的应用做了有益的尝试和探索。计算机辅助诊断在医学影像学方面的应用已经取得了重大进展,但在检验医学方面的应用研究还相对较少。本文详述了基于决策树和模糊聚类分析两种数据挖掘技术的计算机辅助诊断在检验医学中的应用,并由此得出应用的一般模式。血细胞计数实验对于一些疾病具有临床诊断意义,本文重点介绍了运用决策树技术量化基于细胞计数的贫血病的诊断规则,形成诊断模型,将该模型通过代码实现,用于计算机辅助诊断,为贫血病的诊断提供有效的诊断提示。该实验的数据来自于医院的检验信息系统。为提高数据挖掘的效率,必须针对主题对数据属性进行维规约,排除无关属性,保留相关属性。维规约采用贪心算法,逐步向前选择有用属性。在属性的相关性分析中采用了熵增益技术,设定最小信息增益,引入新的属性后计算熵增益值,和最小信息增益阈值比较,来决定属性的有用性。决策树挖掘是数据挖掘中的重要应用之一。本文采用了经典的ID3算法,在阐述了ID3算法及其改进算法(C4.5算法)后,对基于细胞计数的贫血病的临床诊断标准进行维规约,并运用ID3算法生成决策树模型,进而将该模型用代码实现,用于计算机的辅助诊断。胃病是威胁人类健康的高发病之一,以往对于胃病的诊断,更多的是依靠医师的医疗知识和临床经验。本文提出模糊聚类与逐步判别分析相结合的方法,用于胃病的计算机辅助诊断。本文首先介绍了模糊聚类及逐步判别分析的有关内容,并以此建立医学疾病辅助诊断模型。然后结合实例分析,对从医院消化内科收集到的156例胃病患者,构造模糊相似矩阵,计算传递偏差并结合临床经验选取恰当的λ。在模糊聚类分析的基础上,选用贝叶斯意义下的逐步判别分析模型,将有显著作用的因素保留在判别函数中,不显著的去掉。依此对患者进行预测诊断。在对所收集的100例原始病例所做的回代验证中,诊断符合率达96.0%,在对另外的56例患者的预测诊断中,符合率也达到了91.1%,取得了良好的效果。该模型通过VB实现,整个诊断过程在计算机上进行,实现了胃病的计算机辅助诊断。基于数据挖掘的计算机辅助诊断在检验医学中的应用还处于探索阶段,本文也仅就数据挖掘中的两种方法的应用进行了论述,数据挖掘中的其他方法甚至几种方法的结合都可以应用到计算机的辅助诊断,这些研究都将在后续的工作中进一步展开。