健康体检数据仓库的构建及相关数据挖掘

健康体检数据仓库的构建及相关数据挖掘

论文摘要

随着信息化的不断发展以及人们对健康的日益重视,健康体检数据库中积累了大量宝贵的数据,但是还没有得到充分利用。如何充分利用已有的体检数据更好的辅助医生及管理人员为客户提供更好的医疗检查就是本文的研究重点。首先,由于历史数据逐年增多,慈铭健康体检集团规模不断扩大,原有的数据库系统已经无法负荷急剧增长的数据量,也无法从整个企业的角度进行统计分析,构建数据仓库是必经之路。因此,本文结合公司的实际情况,给出了一个分布式数据仓库的模型,描述了其体系结构设计、逻辑模型设计及数据更新方法,并进行了相应的数据分析。其次,针对如何合理制定体检项目组合的问题,本文研究了水平加权关联规则。其中权值的设计借鉴了传统IR领域的TF*IDF的权值定义思想,给出了科室的权值定义公式。通过结合权值归一化思想,使加权支持度不大于1,更易于理解。最后通过比较加权关联规则算法与传统非加权关联规则算法在本文中的应用效果,证明了加权关联规则在本文中的适用性,完成了制定体检项目组合的任务。最后,为了辅助客服医生针对每个客户特点为其推荐合适的体检项目组合,本文研究了基于粗糙集的关联规则挖掘方法,并着重研究了其中的求核算法。由于本文中预处理后的决策表存在大量的不相容记录,并且这些不相容记录属于客观事实,无法进行简单删除,原有的求核算法不再适用。针对这个问题,本文给出了纵向加权求核方法:根据数据的不相容程度,对记录进行纵向加权,删除权值低于给定权值的记录,并再次根据记录的权值计算核属性的权值,最后根据核属性权值决定保留的核属性。实验表明,该方法具有很好的灵活性,通过医生的配合,实现了项目的需求。本文结合北京慈铭健康体检集团的实际数据库,运用上述数据挖掘方法进行相应需求的数据挖掘,并得到了挖掘结果,达到了辅助决策的目的。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题的来源及研究背景
  • 1.2 国内外研究现状
  • 1.3 本文的工作
  • 1.4 论文组织结构
  • 2 数据仓库与数据挖掘概述
  • 2.1 数据仓库
  • 2.2 数据挖掘
  • 2.3 关联规则挖掘
  • 2.3.1 关联规则相关概念
  • 2.3.2 关联规则的性质
  • 2.3.3 关联规则挖掘的步骤
  • 2.3.4 关联规则挖掘的扩展
  • 3 体检分布式数据仓库的构建
  • 3.1 问题描述
  • 3.2 体检分布式数据仓库的构建
  • 3.2.1 体系结构设计
  • 3.2.2 逻辑模型设计
  • 3.2.3 数据更新
  • 3.3 统计分析
  • 4 加权关联挖掘研究与应用
  • 4.1 问题描述
  • 4.2 加权关联规则
  • 4.2.1 加权关联规则模型
  • 4.2.2 MINWAL(0)算法
  • 4.2.3 改进的加权关联规则算法
  • 4.3 加权关联挖掘在体检数据库中的应用
  • 4.3.1 数据映射
  • 4.3.2 数据清理
  • 4.3.3 结构转换
  • 4.3.4 权值的定义与计算
  • 4.3.5 挖掘结果对比及说明
  • 5 粗糙集理论研究与应用
  • 5.1 问题描述
  • 5.2 粗糙集
  • 5.2.1 粗糙集与关联规则
  • 5.2.2 基于粗糙集的关联规则挖掘模型
  • 5.3 属性约简
  • 5.3.1 属性约简方法
  • 5.3.2 区分矩阵求属性约简
  • 5.4 带阈值的纵向加权求核方法
  • 5.4.1 求核方法
  • 5.4.2 带阈值的纵向加权求核算法
  • 5.5 粗糙集理论在体检数据库中的应用
  • 5.5.1 数据预处理
  • 5.5.2 属性约简
  • 5.5.3 关联规则挖掘
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  

    健康体检数据仓库的构建及相关数据挖掘
    下载Doc文档

    猜你喜欢