基于数据仓库ETL技术的数据提取与数据转换研究

基于数据仓库ETL技术的数据提取与数据转换研究

论文摘要

数据仓库技术是近年来迅速发展的一项数据存储管理技术,由于数据仓库技术具有高度的数据集成性并能良好的处理异构型数据等特点,使其迅速受到了很多行业的青睐。它的面世极大的推进了决策分析领域的进一步的技术优化,并且改善了传统数据库技术的一些缺陷,使数据具有更好的集成性、稳定性并且兼备传统数据库的优点。将数据仓库技术应用到决策分析领域,可以很好的从大量的数据信息中提取出决策所需的有价值的数据,通过数据分析,更快捷的做出相应的决策。因此,在决策分析领域很有必要采用数据仓库技术。本课题研究的数据提取与数据转换技术是建立数据仓库过程中获取原始数据并对数据进行加工过程的关键部分。数据提取与数据转换技术基于数据仓库ETL(Extract, Transform, Load)层中的“抽取”与“转换”两部分,“抽取”是访问数据库系统等外部数据源,并从中将数据仓库所需的数据提取出来,“转换”的过程是将“抽取”步骤所得的来源于不同数据源的异构的数据信息,通过数据仓库预定的模式,转化成为具有统一的数据格式的数据,从而便于数据仓库对这些数据进行具体的数据操作。本课题的研究过程中设计了实现数据提取与数据转换的算法及相关研发框架图,将数据提取与数据转换功能设计为访问数据源模块、从数据源中提取数据模块、数据格式转换模块等三个功能模块来实现。访问数据源模块通过CDatabase基类结合接口连接外部数据源,通过统一的数据访问接口来访问不同的数据源,实现对外部数据源的访问。从数据源中提取数据模块利用过程语言和调用接口方法来提取数据源中的数据,访问数据源之后,从数据源中获取所需的数据信息,包括数据表名、数据表中的列名及数据表中的详细信息。数据格式转换模块结合VC++技术与数据仓库技术完成对提取的异构数据的结构转换,将来源于数据源的异构的原始数据转化为具有统一格式的适用于数据仓库的数据,如浮点型数据、时间型数据等,在数据存储到数据仓库前,先进行数据格式的转化,赋予这些数据统一的数据格式。便于数据仓库对数据进行访问。通过这三个功能模块的实现串联了数据仓库与外部数据源,并支持连接SQL、MDB、Oracle等多种类型数据库系统,完成了数据仓库从外部数据源进行数据提取并转换的功能流程,以便于进行后续的存储、查询、分析等操作。本课题研究的数据提取与数据转换技术可在Windows环境下完成数据仓库从存储原始数据的应用系统中提取面向主题的所需数据集合,并对数据进行合理加工以适应数据仓库的要求,对企业构建数据仓库进行决策分析过程中的整理核心数据并进行数据分析具有帮助作用,以加快决策分析的工作效率,可以良好的应用到采用数据仓库技术的行业决策分析领域。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 论文的背景及意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 主要工作和论文结构
  • 第2章 数据仓库理论概述
  • 2.1 数据仓库的定义
  • 2.2 数据仓库的特征
  • 2.3 数据仓库的基本概念
  • 2.4 数据仓库与数据库的比较
  • 2.4.1 数据仓库与数据库之间的差异
  • 2.4.2 数据仓库与数据库之间的联系
  • 2.5 本章小结
  • 第3章 数据提取和转换技术的设计
  • 3.1 系统需求分析
  • 3.2 软件系统的框架设计和功能模块的划分
  • 3.3 程序设计
  • 3.3.1 访问数据源模块的设计
  • 3.3.2 数据提取模块的设计
  • 3.3.3 数据转换模块的设计
  • 3.4 本章小结
  • 第4章 数据提取和转换技术的实现
  • 4.1 配置数据源
  • 4.2 访问多个数据源模块的实现
  • 4.3 从数据源中提取数据模块的实现
  • 4.4 数据格式转换模块的实现
  • 4.5 实现效果
  • 4.6 本章小结
  • 第5章 结论
  • 作者简介及在学期间所取得的科研成果
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].命名实体识别在数字人文中的应用——基于ETL的实现[J]. 图书馆论坛 2020(05)
    • [2].ETL多数据流并行抽取系统的设计与实现[J]. 广东技术师范学院学报 2015(08)
    • [3].ETL技术在餐饮业油水分离器监测系统中的应用[J]. 数字技术与应用 2016(04)
    • [4].充分运用ETL工具,构建完整的数据仓库体系结构[J]. 科技创新与应用 2015(17)
    • [5].基于ETL技术的医院绩效管理系统设计与实现[J]. 中国数字医学 2015(11)
    • [6].基于云计算的数据仓库ETL系统研究与优化[J]. 湘南学院学报 2014(02)
    • [7].ETL多数据流并行抽取中监控的研究与设计[J]. 微计算机信息 2011(03)
    • [8].数据仓库中ETL过程及技巧浅析[J]. 中国科技信息 2009(02)
    • [9].一种面向数据仓库的ETL多层实现策略[J]. 福建电脑 2009(12)
    • [10].浅谈数据仓库中ETL的重要性[J]. 科技信息(科学教研) 2008(18)
    • [11].点击流数据仓库中的ETL技术[J]. 科技信息(科学教研) 2008(20)
    • [12].ETL技术在复杂数据迁移项目中的应用[J]. 西安工程大学学报 2008(04)
    • [13].数据仓库维度建模与ETL过程[J]. 辽宁高职学报 2008(10)
    • [14].基于子模式的关系数据到图数据ETL方法研究[J]. 计算机工程与应用 2017(12)
    • [15].汽车行业数据仓库应用敏捷型ETL过程的研究[J]. 现代计算机(专业版) 2015(34)
    • [16].基于自主式ETL的煤炭企业统一数据交换平台的设计与实现[J]. 中国煤炭 2014(08)
    • [17].基于ETL等技术的建设用地三级联动技术研究[J]. 国土资源信息化 2013(02)
    • [18].数据映射技术在ETL过程中的应用[J]. 计算机系统应用 2012(07)
    • [19].数据仓库与ETL技术在超市中的应用研究[J]. 电脑知识与技术 2011(18)
    • [20].数控机床传感器数据分析中ETL系统改进[J]. 计算机系统应用 2017(09)
    • [21].基于ETL技术的数据交换平台在电子政务领域中的应用[J]. 电脑知识与技术 2016(21)
    • [22].ETL技术在运营商数据仓库中的应用[J]. 电信快报 2015(11)
    • [23].教学管理数据仓库中ETL的实现[J]. 科技创新导报 2011(16)
    • [24].基于数据仓库的一种通用ETL工具的设计与实现[J]. 电脑知识与技术 2008(26)
    • [25].高校数据仓库多层架构设计与ETL实现[J]. 上海工程技术大学学报 2015(02)
    • [26].人保财险公司数据仓库数据ETL的设计[J]. 计算机光盘软件与应用 2014(12)
    • [27].一种人口信息共享的ETL设计方案[J]. 西南民族大学学报(自然科学版) 2011(05)
    • [28].点击流数据仓库中ETL子系统的应用研究[J]. 硅谷 2009(07)
    • [29].ETL在金融信贷风险数据仓库中的应用[J]. 中国科技信息 2009(10)
    • [30].数据仓库中ETL技术的研究与改进[J]. 甘肃科技 2012(19)

    标签:;  ;  ;  

    基于数据仓库ETL技术的数据提取与数据转换研究
    下载Doc文档

    猜你喜欢