论文摘要
本文在系统介绍数据挖掘技术相关知识的基础上,重点研究了建立数据仓库的技术和决策树挖掘算法及其在医疗设备绩效预测中的应用。目前,医疗机构把绝大部分的经营积累用于购置医疗设备,每年用于购置医疗设备的费用约占当年形成的可动用资金的80%,因此,医疗设备效益的好坏直接关系到医疗机构的经营状况,直接关系到医疗机构能否为广大患者提供良好的服务、能否稳定、持续地发展的重要课题。正因为如此,卫生部《医院管理评价指南(试行))》中要求医疗机构购置大型医疗设备必须经过严格的可行性论证并加强大中型医疗设备合理应用成本分析,而对医疗设备在购置前就对其投入使用后的绩效进行预测,是医疗设备购置前进行可行性论证中最为关键的一环,也是医疗设备投入使用后进行合理应用成本分析的前提。数据挖掘技术当前已经成为数据库和信息决策领域的前沿研究方向之一,受到国内外学术界的广泛关注,在商业、工业和医学领域都得到了较为广泛的应用,取得了显著的社会及经济效益。因此,应用数据挖掘技术的理论和方法,对医疗设备的绩效预测方法进行深入的研究,对于充分发挥医疗设备的社会效益和经济效益,具有重要意义。近年来,随着计算机技术、网络技术的迅速发展和医院信息系统(HIS)在医院的普及和广泛应用,虽然HIS中包含有病人信息管理模块和医疗设备管理模块,但两者是相互分离的,相应的软件模块仅局限于分别对病人信息和医疗设备信息进行录入、修改、查询、统计等简单功能的实现,停留在基于数据库技术支持的操作型事务处理的水平上。对医疗设备购置前的可行性论证的决策支持和投入使用后的设备使用、维护等信息的深层次加工较少,如何充分利用这些宝贵的信息资源来为医院的管理者和决策者实施对医疗设备的高效管理和科学决策提供准确、可靠的依据,提高医疗设备的社会效益和经济效益,促进医院的快速健康发展,已成为人们关注的焦点。数据挖掘(Data Mining,DM)也称为数据库知识发现(Knowledge Discovery in Database,KDD),这一术语出现于1989年,是从数据库中识别出有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程。数据挖掘技术在90年代有了突飞猛进的发展,数据挖掘从理论和技术上继承了知识发现领域的成果,同时,它还借鉴了许多其它领域的理论和算法,如数据库系统、机器学习、模式识别、人工智能、数据可视化、信息检索以及统计学等。数据挖掘本质上可归类为深层次的数据分析方法。数据分析本身已经有很多年的历史,不过由于以往计算能力的局限性,限制了对大量数据进行分析的复杂数据分析方法的应用。近年来,由于电子信息技术的发展及应用的普及,商业、医疗及其它领域都产生了大量的业务数据,分析这些数据可以为决策提供真正有价值的信息,因此具有重要的意义。数据挖掘的结果通常表示为概念、规则、规律、模式、约束、可视化等形式。通过数据挖掘所获得的知识可以直接用于辅助决策或修正已有的知识体系,也可作为新的知识存储于应用系统中。数据挖掘的原始数据可以是结构化的;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单统计、查询,提升到从数据中挖掘知识,提供决策支持。数据挖掘需要良好的数据组织和纯净的数据,数据的质量直接影响数据挖掘的效果,而数据仓库的特点恰恰最符合数据挖掘的需求,它从各类数据源中抽取数据,经过清洗、集成、选择、转换等处理,为数据挖掘所需要的高质量数据提供了保证。数据仓库是数据库技术发展的高级阶段,它是面向主题的、集成的、内容相对稳定的、随时间变化的数据集合,可以用来支持管理决策的定制过程。数据仓库系统允许将各种应用系统、多个数据库集成在一起,为统一的历史数据分析提供坚实的平台,其主要目的是为决策提供支持,为OLAP、数据挖掘等深层的数据分析提供平台。可以说,数据挖掘为数据仓库提供了有效的分析处理手段,数据仓库为数据挖掘准备了良好的基础。SOL Server 2005 Integration Services(SSIS)是用于创建高性能的数据集成解决方案的平台,它能够执行抽取(extraction),转换(transformation)和加载(load),缩写为ETL,用于为数据仓库提供服务。SSIS提供了工作流环境,可以使用该环境来构建数据转换包。可以从不同的数据源中提取数据,然后对该数据执行一系列操作。由于医学数据库是一个复杂数据库,而目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。结合医学信息自身具有的特殊性和复杂性,处理好挖掘过程中的关键技术,医学数据挖掘将有广阔的应用前景。分类和预测是数据挖掘的两种数据分析形式,通常的算法有粗糙集理论、决策树、人工神经网络、渐近计算等,各有优点。应该注意的是大部分算法都不是专业为解决某个问题而特制的,算法之间也并不互相排斥。一般来说并不存在所谓的最好的算法,在最终决定选取哪种算法之前,有可能对各种算法都试一下,然后再选取一个较好的。在实际应用中,可对这些方法进行适当的修改、扩充和优化,从而能在各种特殊的医学数据库中进行分类和预测。本文重点研究决策树算法的原理及方法。决策树算法最基本的原理是递归地将数据拆分成子集,以便每一个子集包含目标变量类似的状态,这些目标变量是可预测属性。每一次对树进行拆分,都要评价所有的输入属性对可预测属性的影响。当这个递归的过程结束时,决策树也就创建完成了。比较有名的决策树算法有ID3算法、ID4算法、ID5R算法、C4.5算法。当今先进的数据挖掘工具都提供多种可供选择的数据挖掘算法。这是因为一种算法不可能完成所有不同类型的数据挖掘任务。本次挖掘任务可分为两部分的任务:分类任务和回归任务。分类任务是:对不同条件下的设备使用情况进行分类。假设疾病例数和设备使用情况存在线性关系:y=ax+b,其中x表示疾病例数,y表示设备使用次数,根据这个公式就能对设备的使用情况进行预测。简单来说,如何得到这个公式的任务就是回归算法的主要任务。同时可以假定,不同的设备和不同的疾病种类会有不同的线性关系(函数),所以需要对不同的关系进行分类,例如‘CT检查’与‘肺炎’存在线性公式y=a1x+b1,‘cT检查’与‘肺癌’存在线性公式y=a2x+b2。对于本次挖掘任务,决策树算法与其它的数据挖掘算法相比有一定优势,如利用决策树算法可以快速创建挖掘模型,并且创建的模型也容易解释。每一条从根节点到叶节点的路径就是一条规则,基于决策树的预测也非常高效。本次任务主要是对医疗设备的绩效进行预测,因此,用决策树算法来完成本次挖掘任务是一个较好的选择。SQL Server 2005 Analysis Services(SSAS)的决策树算法(MicrosoftDecision Trees)是一个混合决策树算法,Microsoft线性回归算法不拆分数据,并且回归公式基于整个数据集,这个算法支持分类和回归两种任务。Microsoft回归树的每一个叶节点都有一个线性回归公式。在每一个回归模型中至少有一个回归量(regressor)。回归量是一个连续的输入属性,这个输入属性采用线性的方式对连续的可预测属性进行建模。例如,使用B超次数是一个连续的可预测属性,则疾病例数就是一个回归量。经典的线性回归公式是:使用B超次数=a+b*疾病例数+e,其中:e代表噪声,其平均值为0,系数a(截距)和b(斜率)由残差方程决定。本文对数据挖掘技术的理论和方法进行了研究探讨,并将其应用于基于数据挖掘技术的医疗设备绩效预测的研究中,在对得到的数据挖掘模型进行测试、评估时,CT、MRI、CR、B超、彩超、电子胃镜、电子肠镜等7台(类)设备的预测值与实际值基本相符。通过本研究,基本实现了在医疗设备购置前对其投入使用后的绩效进行较为准确的预测,并为开展合理应用成本分析奠定了良好的基础,进一步的深入研究,可实现对医疗设备从购置前的可行性论证到淘汰报废的全过程提供决策支持,使医疗设备的全寿命期都纳入管理者的统筹管理之中,较好地解决医疗设备绩效、代价、风险等互相制约的难题,充分发挥医疗设备的社会效益和经济效益。
论文目录
相关论文文献
- [1].数据挖掘技术在网络营销中的应用构架实践[J]. 营销界 2019(19)
- [2].数据挖掘技术综述浅析[J]. 数字技术与应用 2019(10)
- [3].基于云计算的数据挖掘技术研究[J]. 无线互联科技 2019(22)
- [4].数据挖掘技术在录井原油性质判别中的应用[J]. 录井工程 2019(04)
- [5].大数据挖掘技术在高职教育教学过程中的应用研究[J]. 计算机产品与流通 2020(01)
- [6].基于大数据背景的数据挖掘技术算法研究[J]. 信息技术与信息化 2019(12)
- [7].基于云计算技术视角的大数据挖掘技术分析[J]. 数字技术与应用 2019(11)
- [8].基于数据挖掘技术的“肥仔水”市场潜力分析——以八爪鱼为例[J]. 电脑知识与技术 2019(34)
- [9].数据挖掘技术在互联网领域的应用研究[J]. 电脑知识与技术 2019(36)
- [10].数据挖掘技术在数据统计工作中的应用分析[J]. 中外企业家 2020(05)
- [11].基于数据挖掘技术的荨麻疹治疗研究综述[J]. 科技与创新 2020(04)
- [12].基于数据挖掘技术的创新设计思维研究[J]. 设计 2020(03)
- [13].数据挖掘技术在中医肝系病中的应用现状[J]. 江西中医药大学学报 2020(01)
- [14].数据挖掘技术在中医辨证施治中的应用[J]. 教育教学论坛 2020(03)
- [15].数据挖掘技术在军队预算管理中的应用探析[J]. 财务与会计 2019(19)
- [16].云计算背景下物联网数据挖掘技术分析与实验验证[J]. 数字通信世界 2020(02)
- [17].数据挖掘技术在经济统计中的应用研究[J]. 中国市场 2020(08)
- [18].基于数据挖掘技术的学情分析系统分析与设计[J]. 电脑编程技巧与维护 2020(01)
- [19].数据挖掘技术及其分析方法在大通水文站降水规律分析中的应用[J]. 科学技术创新 2020(03)
- [20].数据挖掘在油田开采中的应用方法分析[J]. 门窗 2019(18)
- [21].电网故障信息数据挖掘技术的分析[J]. 科技创新导报 2019(33)
- [22].基于数据挖掘技术的高职院校财务管理风险管控研究[J]. 河北建筑工程学院学报 2019(03)
- [23].数据挖掘技术支持下的妇幼保健院档案整合策略[J]. 黑龙江档案 2020(01)
- [24].基于数据挖掘技术的高校人才培养模式评价与优化[J]. 大连民族大学学报 2020(01)
- [25].探究计算机数据挖掘技术的开发及其应用[J]. 计算机产品与流通 2020(03)
- [26].数据挖掘技术在经济统计中的应用研究[J]. 现代商业 2020(05)
- [27].数据挖掘技术在软件工程中的应用[J]. 信息通信 2020(02)
- [28].管理会计中数据挖掘技术的应用研究[J]. 信息记录材料 2020(01)
- [29].基于数据挖掘技术的图书馆个性化系统设计[J]. 长春师范大学学报 2020(04)
- [30].数据挖掘技术在教育信息中的应用探索[J]. 信息通信 2020(03)