基于元数据的病例资源库ETL工具设计与实现

基于元数据的病例资源库ETL工具设计与实现

论文摘要

某医院信息化建设的发展,迫切需要建立一个数据仓库,为临床辅助诊断和日常管理决策等提供支持。病例资源库系统正是应医院的要求而开发,集成医院信息系统的数据,通过数据挖掘技术,挖掘和分析出数据价值,用于辅助临床诊断和支撑管理决策,以及科研、教学。ETL(Extract Transformation Loading,ETL)工具就是处理从医院的多个信息系统中获取业务数据,进行数据清洗和和转换,存储到病例资源库中的过程。本文的研究目标是实现一个具有病例资源库特点的ETL工具,处理从数据源抽取数据导入到病例资源库中。本文首先分析了病例资源库对ETL工具的需求,分析了数据源数据的特点,基于元数据的思想设计出ETL工具的体系结构。然后重点设计了ETL工具中元数据的结构,设计了ETL模块的处理流程,最后根据设计的结果实现了ETL工具。在设计和实现中,ETL工具中的元数据,中间产生的临时数据,都采用XML进行组织和存储,并且数据的清洗和转换方法也都是基于XML的。通过元数据技术,大大减轻了ETL工具实现的复杂度,提高了系统的扩展性以及灵活度。元数据文件中规则制定的策略是本文的一个探索。在ETL的整个流程中,数据的处理都是在XML文件上进行,而不是传统的数据库,这也是本文对ETL工具的一个探索。本文设计和实现的ETL工具已经交付某医院,系统的可用性、稳定性和扩展性都得到了实际验证。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 现状分析
  • 1.3 主要内容
  • 1.4 论文结构
  • 第2章 相关技术
  • 2.1 ETL技术
  • 2.1.1 ETL概念
  • 2.1.2 数据抽取
  • 2.1.3 数据清洗
  • 2.1.4 数据转换
  • 2.1.5 数据加载
  • 2.2 元数据技术
  • 2.2.1 元数据概念
  • 2.2.2 元数据分类
  • 2.2.3 元数据的作用
  • 2.2.4 ETL中的元数据
  • 2.3 XML技术
  • 2.3.1 XML技术简介
  • 2.3.2 XML文档结构
  • 2.3.3 XML相关技术
  • 2.4 本章小结
  • 第3章 病例资源库ETL工具需求分析
  • 3.1 病例资源库概述
  • 3.1.1 病例资源库背景
  • 3.1.2 病例资源库功能结构
  • 3.1.3 病例资源库体系结构
  • 3.2 ETL工具需求分析
  • 3.2.1 功能需求
  • 3.2.2 性能需求
  • 3.3 本章小结
  • 第4章 基于元数据的ETL工具设计
  • 4.1 架构设计与元数据设计
  • 4.1.1 设计目标
  • 4.1.2 体系结构
  • 4.1.3 ETL流程控制方案
  • 4.1.4 元数据设计
  • 4.2 数据抽取模块的设计
  • 4.3 数据清洗模块的设计
  • 4.3.1 案例编辑
  • 4.3.2 DICOM头信息处理
  • 4.4 数据转换模块的设计
  • 4.4.1 病例模块划分
  • 4.4.2 影像序列化
  • 4.5 数据加载模块的设计
  • 4.6 本章小结
  • 第5章 基于元数据的ETL工具实现
  • 5.1 元数据的实现
  • 5.1.1 抽取规则文件的实现
  • 5.1.2 清洗规则文件的实现
  • 5.1.3 转换规则文件的实现
  • 5.1.4 加载规则文件的实现
  • 5.2 数据抽取模块的实现
  • 5.3 数据清洗模块的实现
  • 5.4 数据转换模块的实现
  • 5.5 数据加载模块的实现
  • 5.6 系统测试与分析
  • 5.6.1 测试环境
  • 5.6.2 测试方法与结果
  • 5.7 本章小结
  • 第6章 总结与展望
  • 6.1 工作总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].命名实体识别在数字人文中的应用——基于ETL的实现[J]. 图书馆论坛 2020(05)
    • [2].ETL多数据流并行抽取系统的设计与实现[J]. 广东技术师范学院学报 2015(08)
    • [3].ETL技术在餐饮业油水分离器监测系统中的应用[J]. 数字技术与应用 2016(04)
    • [4].充分运用ETL工具,构建完整的数据仓库体系结构[J]. 科技创新与应用 2015(17)
    • [5].基于ETL技术的医院绩效管理系统设计与实现[J]. 中国数字医学 2015(11)
    • [6].基于云计算的数据仓库ETL系统研究与优化[J]. 湘南学院学报 2014(02)
    • [7].ETL多数据流并行抽取中监控的研究与设计[J]. 微计算机信息 2011(03)
    • [8].数据仓库中ETL过程及技巧浅析[J]. 中国科技信息 2009(02)
    • [9].一种面向数据仓库的ETL多层实现策略[J]. 福建电脑 2009(12)
    • [10].浅谈数据仓库中ETL的重要性[J]. 科技信息(科学教研) 2008(18)
    • [11].点击流数据仓库中的ETL技术[J]. 科技信息(科学教研) 2008(20)
    • [12].ETL技术在复杂数据迁移项目中的应用[J]. 西安工程大学学报 2008(04)
    • [13].数据仓库维度建模与ETL过程[J]. 辽宁高职学报 2008(10)
    • [14].基于子模式的关系数据到图数据ETL方法研究[J]. 计算机工程与应用 2017(12)
    • [15].汽车行业数据仓库应用敏捷型ETL过程的研究[J]. 现代计算机(专业版) 2015(34)
    • [16].基于自主式ETL的煤炭企业统一数据交换平台的设计与实现[J]. 中国煤炭 2014(08)
    • [17].基于ETL等技术的建设用地三级联动技术研究[J]. 国土资源信息化 2013(02)
    • [18].数据映射技术在ETL过程中的应用[J]. 计算机系统应用 2012(07)
    • [19].数据仓库与ETL技术在超市中的应用研究[J]. 电脑知识与技术 2011(18)
    • [20].数控机床传感器数据分析中ETL系统改进[J]. 计算机系统应用 2017(09)
    • [21].基于ETL技术的数据交换平台在电子政务领域中的应用[J]. 电脑知识与技术 2016(21)
    • [22].ETL技术在运营商数据仓库中的应用[J]. 电信快报 2015(11)
    • [23].教学管理数据仓库中ETL的实现[J]. 科技创新导报 2011(16)
    • [24].基于数据仓库的一种通用ETL工具的设计与实现[J]. 电脑知识与技术 2008(26)
    • [25].高校数据仓库多层架构设计与ETL实现[J]. 上海工程技术大学学报 2015(02)
    • [26].人保财险公司数据仓库数据ETL的设计[J]. 计算机光盘软件与应用 2014(12)
    • [27].一种人口信息共享的ETL设计方案[J]. 西南民族大学学报(自然科学版) 2011(05)
    • [28].点击流数据仓库中ETL子系统的应用研究[J]. 硅谷 2009(07)
    • [29].ETL在金融信贷风险数据仓库中的应用[J]. 中国科技信息 2009(10)
    • [30].数据仓库中ETL技术的研究与改进[J]. 甘肃科技 2012(19)

    标签:;  ;  ;  ;  ;  

    基于元数据的病例资源库ETL工具设计与实现
    下载Doc文档

    猜你喜欢