论文摘要
数据仓库技术是在数据库基础上发展而来的新一代信息管理技术,主要用于支持企业信息集成、数据挖掘、企业决策支持等应用。在数据仓库建设过程中,由于各工具厂商采用不同的元数据标准,使得依靠这些工具进行数据集成、数据共享显得十分困难,由此引发了人们对元数据的研究。2001年OMG组织在其已制定的规范UML、MOF、XMI的基础上提出公共仓库元模型(CWM)。本文首先系统地介绍了CWM的体系结构,对CWM中每个包的内容以及包与包之间的关系都进行了深入的剖析。在对CWM规范、对历史上元数据的管理策略和元数据解决方案的深入研究,同时对该商业银行各类信息系统的集成需求分析之后,论文决定采纳元数据仓库(MDW)的管理策略,在该商业银行搭建基于CWM的元数据仓库的集成体系结构。接着本文从整个元数据生命周期出发,有特色地设计了元数据仓库的六个组件:来源层、集中层、仓储、集市、管理层、交换层,全面管理各生命周期的元数据。对于元数据仓库的核心组件——元数据仓储,论文以较大篇幅详述了其三层架构的设计,同时论文进行了大胆而有效的实践,这种三层架构具备高度的适应性、扩展性,不仅在国内处于领先地位,开发的产品也可与国际知名的元数据产品相提并论。与传统的数据仓库DB/DW两层结构不同,论文所在的商业银行正积极构建包含数据仓库在内的三层数据架构,即DB/ODS/DW三层结构的信息体系,因此论文是站在企业的角度来考虑元数据的,相较以往基于数据仓库的元数据研究,可以说是又前进了一大步。最后论文以实践来说明,如何结合CWM规范在元数据仓储层设计数据字典、数据转换、数据质量、业务应用四大主题的元模型,并在元数据仓库中对四大主题的元数据进行集成与管理,有效地支持了该商业银行信息体系建设的工作。