基于CWM的ETL在数据中心中的应用研究

基于CWM的ETL在数据中心中的应用研究

论文摘要

随着数据仓库应用的不断推广,构建数据仓库的各种工具也不断涌现出来。为了支持整个数据仓库环境中各部分之间的无缝集成,这些工具需要彼此协作,使数据流能在各个工作环节中畅通流动。同时尽量保证信息的完整性和正确性,为此,数据仓库中的元数据必须有统一良好的定义。ETL在数据仓库和商业智能中都是重要的组成部分,而且ETL的开发在整个数据仓库项目开发周期中也是比较耗时的部分。在数据仓库开发过程中,开发人员通常更关注业务元数据和技术元数据,却忽视了ETL元数据的管理,导致ETL开发周期的延长。目前,元数据管理结构有两种:一种是集中式的元数据管理结构,即整个系统只有一个元数据仓储,所有工具和数据仓库直接从这个中心元数据仓储中获取元数据信息,这种结构只适合于中小规模的企业。对于大型企业中数据环境较为复杂的应用场景,集中管理几乎不可能。另一种是分散式的元数据管理结构,这种结构建立了若干个分布的、相对自治的元数据仓储,分别处理某个单一领域的元数据,而全局元数据则由元数据管理系统来管理。这种分散式结构虽然分散管理元数据,但在共享元数据部分由于要从不同元数据库中得到元数据,并且不同的元数据库有可能使用不同的元数据定义形式,所以仍然要解决元数据异构的问题。而且这些分布的、自治的元数据库间的集成不可避免地要用到元数据交换协议,因此也延长了开发周期。公共仓库元模型(CWM)是一种基于UML设计的,用于建立公共仓库的元模型,并且是面向对象的模型。本文对CWM进行了深入研究,运用该模型对ETL元数据建模,将对象模型映射到关系模型,并建立相应的元数据库,最后将设计的元数据库应用到浦东数据中心数据管理子系统。通过对ETL元数据的有效管理,可以更加直观地将ETL数据源、转换规则以及映射关系反映给ETL工程师,便于ETL的开发和ETL元数据的维护。文章首先介绍了元数据、ETL和ETL元数据等相关概念,深入研究了CWM模型的整体架构、设计原则、各组成包的功能以及包之间的关系,重点分析了CWM中与ETL相关的包。然后,利用CWM中的相关包设计了面向对象的ETL元数据模型,并将其转化成关系模型即ETL元数据的ER图以及关系型的ETL元数据库。最后,将设计应用到浦东数据中心项目。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 本课题研究内容
  • 1.4 本文的组织结构
  • 第二章 相关理论研究
  • 2.1 元数据概述
  • 2.2 ETL及ETL元数据概述
  • 2.3 本章小结
  • 第三章 公共仓库元模型CWM
  • 3.1 CWM简介
  • 3.2 CWM体系结构
  • 3.3 CWM对ETL元数据管理的支持
  • 3.4 本章小结
  • 第四章 基于CWM的关系型ETL元数据库的设计
  • 4.1 ETL元数据库设计概述
  • 4.2 面向对象的ETL元模型设计
  • 4.3 ETL元数据ER图
  • 4.4 面向对象的ETL元模型到关系数据库的映射
  • 4.5 本章小结
  • 第五章 浦东数据中心项目中ETL元数据管理的应用
  • 5.1 浦东数据中心项目概述
  • 5.2 ETL元数据的存储
  • 5.3 元数据库的操作
  • 5.4 系统实现
  • 5.5 ETL元数据管理的优点
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读学位期间的研究成果目录
  • 致谢
  • 相关论文文献

    • [1].基于CWM的元数据管理策略[J]. 微型机与应用 2011(23)
    • [2].基于CWM的住宅产业可持续发展评价模型研究[J]. 建筑经济 2009(S2)
    • [3].基于CWM的数据仓库元数据管理策略研究[J]. 商场现代化 2009(34)
    • [4].基于描述逻辑的CWM元数据冲突的检测和消解[J]. 计算机科学 2010(11)
    • [5].基于XBRL和CWM的财务信息化研究[J]. 中国城市经济 2012(03)
    • [6].基于CWM构建军事训练元数据模型[J]. 电脑知识与技术 2010(10)
    • [7].基于CWM的模型驱动体系结构的研究[J]. 微计算机信息 2008(27)
    • [8].基于CWM的结构化异构数据抽取方法研究与实现[J]. 计算机应用与软件 2009(12)
    • [9].基于CWM的网络报纸元数据抽取框架模型[J]. 情报科学 2010(03)
    • [10].基于CWM和EMF的数据库元数据处理[J]. 计算机工程 2010(13)
    • [11].基于CWM的商场数据仓库ETL系统架构研究[J]. 商场现代化 2008(26)
    • [12].基于CWM的企业元数据集成中元数据抽取与导出研究[J]. 计算技术与自动化 2008(03)
    • [13].基于CWM的ETL元数据管理系统在电子政务中的研究和设计[J]. 科技信息 2012(17)
    • [14].基于CWM模型的电力数据仓库元数据仓储设计[J]. 福建工程学院学报 2010(03)
    • [15].CWM中基于元模式的数据集成研究与实现[J]. 现代计算机(专业版) 2008(08)
    • [16].基于CWM规范设计的元数据管理系统[J]. 电脑知识与技术 2014(02)
    • [17].基于CWM的ETL元数据库系统模型的设计[J]. 现代图书情报技术 2011(01)
    • [18].基于CWM的元数据集成中交换模式的研究[J]. 西安工程大学学报 2009(03)
    • [19].基于CWM商业报告多维分析模型的构建[J]. 计算机科学 2011(09)
    • [20].元数据存储框架及服务发布[J]. 科技信息 2009(23)
    • [21].全过程元数据驱动的实时BI基础平台研究[J]. 图书馆学研究 2010(22)
    • [22].基于MDA的软件开发方法研究[J]. 福建电脑 2008(10)

    标签:;  ;  ;  

    基于CWM的ETL在数据中心中的应用研究
    下载Doc文档

    猜你喜欢