论文摘要
随着数据仓库应用的不断推广,构建数据仓库的各种工具也不断涌现出来。为了支持整个数据仓库环境中各部分之间的无缝集成,这些工具需要彼此协作,使数据流能在各个工作环节中畅通流动。同时尽量保证信息的完整性和正确性,为此,数据仓库中的元数据必须有统一良好的定义。ETL在数据仓库和商业智能中都是重要的组成部分,而且ETL的开发在整个数据仓库项目开发周期中也是比较耗时的部分。在数据仓库开发过程中,开发人员通常更关注业务元数据和技术元数据,却忽视了ETL元数据的管理,导致ETL开发周期的延长。目前,元数据管理结构有两种:一种是集中式的元数据管理结构,即整个系统只有一个元数据仓储,所有工具和数据仓库直接从这个中心元数据仓储中获取元数据信息,这种结构只适合于中小规模的企业。对于大型企业中数据环境较为复杂的应用场景,集中管理几乎不可能。另一种是分散式的元数据管理结构,这种结构建立了若干个分布的、相对自治的元数据仓储,分别处理某个单一领域的元数据,而全局元数据则由元数据管理系统来管理。这种分散式结构虽然分散管理元数据,但在共享元数据部分由于要从不同元数据库中得到元数据,并且不同的元数据库有可能使用不同的元数据定义形式,所以仍然要解决元数据异构的问题。而且这些分布的、自治的元数据库间的集成不可避免地要用到元数据交换协议,因此也延长了开发周期。公共仓库元模型(CWM)是一种基于UML设计的,用于建立公共仓库的元模型,并且是面向对象的模型。本文对CWM进行了深入研究,运用该模型对ETL元数据建模,将对象模型映射到关系模型,并建立相应的元数据库,最后将设计的元数据库应用到浦东数据中心数据管理子系统。通过对ETL元数据的有效管理,可以更加直观地将ETL数据源、转换规则以及映射关系反映给ETL工程师,便于ETL的开发和ETL元数据的维护。文章首先介绍了元数据、ETL和ETL元数据等相关概念,深入研究了CWM模型的整体架构、设计原则、各组成包的功能以及包之间的关系,重点分析了CWM中与ETL相关的包。然后,利用CWM中的相关包设计了面向对象的ETL元数据模型,并将其转化成关系模型即ETL元数据的ER图以及关系型的ETL元数据库。最后,将设计应用到浦东数据中心项目。
论文目录
相关论文文献
- [1].基于CWM的元数据管理策略[J]. 微型机与应用 2011(23)
- [2].基于CWM的住宅产业可持续发展评价模型研究[J]. 建筑经济 2009(S2)
- [3].基于CWM的数据仓库元数据管理策略研究[J]. 商场现代化 2009(34)
- [4].基于描述逻辑的CWM元数据冲突的检测和消解[J]. 计算机科学 2010(11)
- [5].基于XBRL和CWM的财务信息化研究[J]. 中国城市经济 2012(03)
- [6].基于CWM构建军事训练元数据模型[J]. 电脑知识与技术 2010(10)
- [7].基于CWM的模型驱动体系结构的研究[J]. 微计算机信息 2008(27)
- [8].基于CWM的结构化异构数据抽取方法研究与实现[J]. 计算机应用与软件 2009(12)
- [9].基于CWM的网络报纸元数据抽取框架模型[J]. 情报科学 2010(03)
- [10].基于CWM和EMF的数据库元数据处理[J]. 计算机工程 2010(13)
- [11].基于CWM的商场数据仓库ETL系统架构研究[J]. 商场现代化 2008(26)
- [12].基于CWM的企业元数据集成中元数据抽取与导出研究[J]. 计算技术与自动化 2008(03)
- [13].基于CWM的ETL元数据管理系统在电子政务中的研究和设计[J]. 科技信息 2012(17)
- [14].基于CWM模型的电力数据仓库元数据仓储设计[J]. 福建工程学院学报 2010(03)
- [15].CWM中基于元模式的数据集成研究与实现[J]. 现代计算机(专业版) 2008(08)
- [16].基于CWM规范设计的元数据管理系统[J]. 电脑知识与技术 2014(02)
- [17].基于CWM的ETL元数据库系统模型的设计[J]. 现代图书情报技术 2011(01)
- [18].基于CWM的元数据集成中交换模式的研究[J]. 西安工程大学学报 2009(03)
- [19].基于CWM商业报告多维分析模型的构建[J]. 计算机科学 2011(09)
- [20].元数据存储框架及服务发布[J]. 科技信息 2009(23)
- [21].全过程元数据驱动的实时BI基础平台研究[J]. 图书馆学研究 2010(22)
- [22].基于MDA的软件开发方法研究[J]. 福建电脑 2008(10)