关于数据仓库元数据管理系统的研究与建立

关于数据仓库元数据管理系统的研究与建立

论文摘要

如今很多行业的企业都逐渐意识到,熟练、有效的运用从企业内部获取的信息是实现卓越绩效的关键。甚至有人说,很多数据金矿其实都隐藏在公司的基础运营中,如果把它们挖掘出来,就能够在纷杂的竞争中略胜一筹。现在很多企业都建立了越来越多的业务系统,收集了不同层面和内容的企业内部信息。随着数据仓库技术的不断探索、发展和应用,许多企业已经建成或正在着手建立数据仓库项目,收集、整合数据,运转分析他们的重要业务,以期待发掘他们信息数据更深层的价值。但是,从整个行业来看,这些项目很多并未能取得实质性的突破和胜利。究其原因,主要是因为数据质量太差制约了分析方法价值的发挥。而提升数据质量必须首先保证数据的正确性、明确性、完整性和一致性,即保证数据属性的质量。这使人们逐渐认识到元数据管理和应用的重要性,并开始投入越来越多的资源探索元数据管理和应用之道。本课题以潍柴集团数据仓库项目建设为契机,从数据仓库建设的实际应用出发,在对元数据性质的分析和研究的基础上,找寻一种有效而通用的元数据管理模式,构建了一个符合潍柴数据仓库实际应用的元数据管理系统。本文首先主要研究了数据仓库及元数据的概念、分类、应用。数据仓库是以关系数据库、并行处理和分布式技术为基础的信息新技术。它是一个用以更好地支持企业或组织的决策分析处理、面向主题的、集成的、稳定的、不随时间不断变化的数据集合,用来支持企业经营管理中的决策制定过程。元数据是关于数据的数据,是数据仓库的一个重要组成部分。它描述了数据的属性信息,包括数据的内容、意义、质量、状况以及其他特性。同时也描述了数据仓库内数据的属性和含义,定义了数据的结构、模式、建立方法、来源和抽取、转换规则等,是数据仓库中数据资源的使用指南。从不同角度可以将元数据不同的类别,通常按其用户或用途将其分为技术元数据和业务元数据。本文另外还论述了对元数据管理的方式方法、策略和规范。元数据管理的根本目的是为了提升数据的质量。具体首先是数据仓库建模工具、数据获取工具、前端展现工具等之间的数据传递、交互与整合,另外就是负责存储和维护数据仓库中的元数据,使之能够稳定而准确的协调各模块和工具之间的工作。本文结合数据仓库项目需求实际,在对元数据质量要求深入分析的基础上,探讨了元数据管理的目的、范围与现状,深入分析了元数据管理的规则、标准、成熟度以及元数据管理的策略与规划,同时对元数据模型的结构、特征、应用也做了简要的论述。本文最后借助潍柴数据仓库元数据管理系统的建立,详细阐述了运用系统实现元数据自动化管理的构建方法、策略与实现方式。包括元数据管理系统设计的目的和原则、功能设计与架构设计的内容、管理工具选型的标准与依据,以及最终系统实施的策略、方法和步骤。

论文目录

  • 摘要
  • Abstract
  • 1 前言
  • 1.1 课题研究背景
  • 1.2 国内外研究现状
  • 1.3 课题主要研究内容
  • 2 数据仓库概述
  • 2.1 数据仓库的定义
  • 2.2 数据仓库体系结构
  • 3 元数据概述
  • 3.1 元数据的定义
  • 3.2 元数据的分类
  • 3.3 元数据的生命周期
  • 3.4 元数据的作用
  • 3.5 业务用户对元数据的应用
  • 3.5.1 数据查询与检索
  • 3.5.2 数据血缘与处理过程分析
  • 3.5.3 影响力及相关力分析
  • 3.5.4 数据时效性探察
  • 3.6 技术用户对元数据的应用
  • 3.6.1 数据集成
  • 3.6.2 数据质量控制
  • 4 元数据管理概述
  • 4.1 元数据管理的内容
  • 4.1.1 元数据管理任务
  • 4.1.2 元数据管理目的
  • 4.1.3 元数据管理范围
  • 4.1.4 元数据质量要求
  • 4.2 元数据管理现状
  • 4.3 元数据管理的规则与标准
  • 4.4 元数据管理的五级成熟度
  • 4.5 元数据管理策略
  • 4.6 元数据管理规划
  • 5 建立通用的元数据模型
  • 5.1 MDC 的 OIM 模型
  • 5.2 OMG 的 CWM 模型
  • 5.3 CWM 与 OIM 之间的关系
  • 6 构建元数据管理系统
  • 6.1 元数据管理系统概述
  • 6.1.1 设计目标
  • 6.1.2 设计原则
  • 6.1.3 元数据管理系统主要内容
  • 6.1.4 元数据管理系统建设步骤
  • 6.2 元数据管理系统功能设计
  • 6.2.1 元数据获取
  • 6.2.2 元数据维护
  • 6.2.3 权限管理
  • 6.2.4 版本控制
  • 6.2.5 元数据使用
  • 6.3 元数据管理系统架构设计
  • 6.3.1 元数据管理系统体系结构
  • 6.3.2 元数据管理系统拓扑结构
  • 6.3.3 元数据存储体系设计
  • 6.3.4 元数据应用体系设计
  • 6.4 元数据管理工具选择
  • 6.4.1 元数据管理系统应用工具选择依据
  • 6.4.2 Informatica Metadata Manager产品特点
  • 6.4.3 Informatica Metadata Manager架构
  • 6.5 元数据管理系统实施
  • 6.5.1 元数据管理系统实施准备
  • 6.5.2 元数据管理系统实施方法
  • 6.5.3 元数据管理系统实施步骤
  • 6.5.4 元数据定义
  • 6.5.5 数据库映射
  • 6.6 元数据管理系统应用
  • 7 总结和展望
  • 7.1 工作总结
  • 7.2 工作展望
  • 参考文献
  • 攻读工程硕士期间所发表的文章
  • 个人简历
  • 致谢
  • 相关论文文献

    • [1].数据仓库技术在高速公路数据仓库系统中的应用[J]. 吉林交通科技 2011(01)
    • [2].基于微软数据仓库的农业科技支撑数据应用分析与展望[J]. 农业展望 2019(12)
    • [3].计算机数据仓库的构建原理及发展趋势[J]. 延边教育学院学报 2018(06)
    • [4].七大云计算数据仓库[J]. 计算机与网络 2019(20)
    • [5].基于网络数据仓库及OLAP技术的决策支持系统设计[J]. 网络安全技术与应用 2015(11)
    • [6].大数据环境下动态数据仓库的应用研究[J]. 电子技术与软件工程 2015(02)
    • [7].维数据仓库及其在复杂数据建模中的应用研究[J]. 通讯世界 2015(03)
    • [8].使用数据清洗技术进行中医药数据仓库质量控制研究[J]. 中国数字医学 2012(04)
    • [9].数据仓库构建之行为模式分析[J]. 信息系统学报 2013(01)
    • [10].采用云计算技术构建大型数据仓库平台的解析[J]. 计算机光盘软件与应用 2013(22)
    • [11].再谈数据仓库[J]. 软件和信息服务 2013(02)
    • [12].数据仓库突破者[J]. 软件和信息服务 2010(04)
    • [13].基于SQL Server 2005构建数据仓库的探索[J]. 新课程(教育学术) 2012(01)
    • [14].重塑传统,打造第四代数据仓库[J]. 软件和集成电路 2019(01)
    • [15].基于数据仓库的数据血缘管理研究[J]. 轻工科技 2019(04)
    • [16].数据仓库在区域健康管理大数据平台构建中的应用[J]. 中国卫生信息管理杂志 2019(03)
    • [17].水质监测实验室信息管理系统中数据仓库的运用[J]. 信息系统工程 2019(07)
    • [18].测量数据仓库的概念研究[J]. 遥测遥控 2018(01)
    • [19].生态应急决策支持数据仓库战略设计与实施研究[J]. 镇江高专学报 2018(01)
    • [20].云环境下的分层数据仓库架构及其服务研究[J]. 现代信息科技 2018(01)
    • [21].医院信息化建设中数据仓库技术的应用[J]. 信息与电脑(理论版) 2018(22)
    • [22].基于大数据平台构建数据仓库的研究与实践[J]. 中国金融电脑 2017(05)
    • [23].面向大型装备状态分析的分布式实时数据仓库构建技术[J]. 计算机集成制造系统 2017(10)
    • [24].基于数据仓库和数据采集的高校教学管理决策支持系统研究[J]. 佳木斯职业学院学报 2015(12)
    • [25].农信数据仓库的建设路径[J]. 中国农村金融 2015(02)
    • [26].数据仓库与数据技术的研究与应用[J]. 信息与电脑(理论版) 2014(24)
    • [27].数据仓库可以帮助医疗保健机构达到有效使用[J]. 中国数字医学 2011(07)
    • [28].关于数据库技术与数据仓库的思考[J]. 数字技术与应用 2015(09)
    • [29].浅析地质数据仓库的特点及数据组织[J]. 科学中国人 2016(17)
    • [30].浅析数据仓库与数据挖掘的应用[J]. 内江科技 2014(01)

    标签:;  ;  ;  

    关于数据仓库元数据管理系统的研究与建立
    下载Doc文档

    猜你喜欢