实时数据仓库环境中分区技术的研究与应用

实时数据仓库环境中分区技术的研究与应用

论文摘要

随着企业对数据的实时性的要求的提高,传统的数据仓库技术已无法满足实时性需求。实时数据仓库技术的出现,为企业或组织提供了实时或近实时的数据信息。由于数据实时性的提高,每天都有海量的数据被保存到计算机中,如何在实时数据仓库环境中高效地管理数据的问题也暴露出来。基于数据库的管理技术实现高效的数据管理是解决这一问题的途径之一。本文针对实时数据仓库的特点,以提高实时数据仓库的存储和查询效率为目标,研究了分区技术对实时数据仓库中查询效率的贡献,以及对增量数据的分区存储的问题。从传统的数据库模式特点出发,提出了基于分区表的分区模型和系统化建模流程,包括模型建立、模式抽取和数据迁移等,并从理论依据、实验依据、通用性和扩展性等几个角度详细的论证了此分区表的优越性。针对实时数据仓库的特点,.提出了改进的水平分区算法和基于服务器端改进算法,并详细论证了此方法对查询效率的提升。在此基础上,设计了以上述分区技术为核心的分区引擎,并且将其应于到国家海洋环境数据仓库的开发过程。实验表明,本文所提出的基于分区表的分区策略以及动态分区算法在数据存储和查询领域具有优越的性能,达到了预期的目标。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题来源
  • 1.2 研究背景
  • 1.3 相关工作
  • 1.4 本文组织结构
  • 第二章 数据仓库与分区策略
  • 2.1 数据仓库
  • 2.1.1 数据仓库的特征
  • 2.1.2 数据仓库的体系结构
  • 2.2 实时数据仓库
  • 2.3 分区策略
  • 2.3.1 水平分区
  • 2.3.2 垂直分区
  • 2.4 本章小节
  • 第三章 基于分区表的外部分区模型
  • 3.1 问题的提出
  • 3.2 外部分区
  • 3.2.1 外部分区的定义
  • 3.2.2 必要条件
  • 3.3 PTM模型的定义
  • 3.3.1 相关定义
  • 3.3.2 非分区模式分区化映射
  • 3.3.3 PTM模型
  • 3.4 PTM建模
  • 3.4.1 NPM建模
  • 3.4.2 映射的实现
  • 3.4.3 GPM建模
  • 3.4.4 获取FQG策略
  • 3.4.5 模式抽取
  • 3.4.6 基于映射模型数据迁移技术
  • 3.5 外部分区模型测试
  • 3.5.1 理论依据
  • 3.5.2 实验依据
  • 3.6 通用性和扩展性
  • 3.6.1 统一管理
  • 3.6.2 方便数据导出
  • 3.6.3 简化数据库向整合数据库迁移过程
  • 3.7 本章小结
  • 第四章 实时环境下的动态区间分区算法
  • 4.1 问题的提出
  • 4.1.1 问题描述
  • 4.1.2 传统的区间分区算法
  • 4.2 非等量区间分区算法NEP
  • 4.2.1 适用范围
  • 4.2.2 NEP算法的初始化部分
  • 4.2.3 NEP算法的执行部分
  • 4.2.4 基于服务器端的算法改进
  • 4.3 性能分析
  • 4.3.1 三种分区算法的效率对比
  • 4.3.2 浮动因子对NEP的影响
  • 4.3.3 实验结论
  • 4.4 本章小结
  • 第五章 分区引擎的构建及其在实时数据仓库中的应用
  • 5.1 实现分区引擎的具体技术
  • 5.1.1 Java语言概述
  • 5.1.2 组件技术概述
  • 5.1.3 设计模式概述
  • 5.1.4 JDBC和连接池概述
  • 5.2 总体设计
  • 5.3 组件设计
  • 5.3.1 FQG生成组件
  • 5.3.2 模式抽取组件
  • 5.3.3 动态分区计算组件
  • 5.3.4 SQL语句生成组件
  • 5.3.5 日志组件
  • 5.3.6 变更管理组件
  • 5.4 系统实现过程中解决的若干问题
  • 5.4.1 数据预处理
  • 5.4.2 数据的迁移
  • 5.4.3 分区的调度策略
  • 5.4.4 初装完成后的数据追加阶段
  • 5.5 本章小结
  • 第六章 成功案例
  • 6.1 海洋数据仓库简介
  • 6.2 分区技术海洋数据仓库中的应用
  • 6.2.1 基于分区表的分区策略的应用
  • 6.2.2 内分区策略的应用
  • 6.3 应用评价
  • 6.4 本章小结
  • 第七章 结论和展望
  • 7.1 本论文的主要贡献
  • 7.2 进一步的工作
  • 参考文献
  • 致谢
  • 攻读硕士期间参加的项目及发表的论文
  • 相关论文文献

    • [1].数据仓库技术在高速公路数据仓库系统中的应用[J]. 吉林交通科技 2011(01)
    • [2].基于微软数据仓库的农业科技支撑数据应用分析与展望[J]. 农业展望 2019(12)
    • [3].计算机数据仓库的构建原理及发展趋势[J]. 延边教育学院学报 2018(06)
    • [4].七大云计算数据仓库[J]. 计算机与网络 2019(20)
    • [5].基于网络数据仓库及OLAP技术的决策支持系统设计[J]. 网络安全技术与应用 2015(11)
    • [6].大数据环境下动态数据仓库的应用研究[J]. 电子技术与软件工程 2015(02)
    • [7].维数据仓库及其在复杂数据建模中的应用研究[J]. 通讯世界 2015(03)
    • [8].使用数据清洗技术进行中医药数据仓库质量控制研究[J]. 中国数字医学 2012(04)
    • [9].数据仓库构建之行为模式分析[J]. 信息系统学报 2013(01)
    • [10].采用云计算技术构建大型数据仓库平台的解析[J]. 计算机光盘软件与应用 2013(22)
    • [11].再谈数据仓库[J]. 软件和信息服务 2013(02)
    • [12].数据仓库突破者[J]. 软件和信息服务 2010(04)
    • [13].基于SQL Server 2005构建数据仓库的探索[J]. 新课程(教育学术) 2012(01)
    • [14].重塑传统,打造第四代数据仓库[J]. 软件和集成电路 2019(01)
    • [15].基于数据仓库的数据血缘管理研究[J]. 轻工科技 2019(04)
    • [16].数据仓库在区域健康管理大数据平台构建中的应用[J]. 中国卫生信息管理杂志 2019(03)
    • [17].水质监测实验室信息管理系统中数据仓库的运用[J]. 信息系统工程 2019(07)
    • [18].测量数据仓库的概念研究[J]. 遥测遥控 2018(01)
    • [19].生态应急决策支持数据仓库战略设计与实施研究[J]. 镇江高专学报 2018(01)
    • [20].云环境下的分层数据仓库架构及其服务研究[J]. 现代信息科技 2018(01)
    • [21].医院信息化建设中数据仓库技术的应用[J]. 信息与电脑(理论版) 2018(22)
    • [22].基于大数据平台构建数据仓库的研究与实践[J]. 中国金融电脑 2017(05)
    • [23].面向大型装备状态分析的分布式实时数据仓库构建技术[J]. 计算机集成制造系统 2017(10)
    • [24].基于数据仓库和数据采集的高校教学管理决策支持系统研究[J]. 佳木斯职业学院学报 2015(12)
    • [25].农信数据仓库的建设路径[J]. 中国农村金融 2015(02)
    • [26].数据仓库与数据技术的研究与应用[J]. 信息与电脑(理论版) 2014(24)
    • [27].数据仓库可以帮助医疗保健机构达到有效使用[J]. 中国数字医学 2011(07)
    • [28].关于数据库技术与数据仓库的思考[J]. 数字技术与应用 2015(09)
    • [29].浅析地质数据仓库的特点及数据组织[J]. 科学中国人 2016(17)
    • [30].浅析数据仓库与数据挖掘的应用[J]. 内江科技 2014(01)

    标签:;  ;  ;  ;  ;  ;  

    实时数据仓库环境中分区技术的研究与应用
    下载Doc文档

    猜你喜欢