面向链接分析的数据仓库及联机分析处理系统的研究与应用

面向链接分析的数据仓库及联机分析处理系统的研究与应用

论文摘要

数据仓库和OLAP是90年代初提出的概念,到90年代中期已经形成潮流。在美国,数据仓库已成为仅次于Internet之后的又一技术热点,以数据仓库和OLAP相结合建立的辅助决策支持系统是决策支持系统的新形式。为了便于对单一主题进行分析,对于表征主题间关系的数据,目前的数据仓库技术是通过将其转化成对应的单一主题数据的方式来实现的,从而忽视了这些表征主题间关系数据的存储问题。随着生物信息、互联网和电信等领域数据的不断丰富,数据仓库的应用逐步向链接丰富的数据集发展,新兴的多关系数据挖掘、基于图的数据挖掘、链接挖掘等已逐渐成为数据挖掘研究中的热点,对于表征对象间链接关系数据的提取需求已变得越来越强烈。同时,在这些链接丰富的应用领域,对于链接关系的OLAP分析也同样有着重要的商业需求,如何对链接关系进行多维分析已成为一个重要课题。本文针对目前数据仓库技术对链接分析支持不足的现状,通过对电信领域中用户间通话数据的深入分析,对于表征对象间链接关系的数据,作者提出了一种新的存储方式,并扩展了传统的基于单一对象属性的多维数据模型,使其可以对表征对象间链接关系的统计数据进行有效的表示,且给出了其相关的数学描述,并对各种面向链接的多维分析操作的具体含义给予了解释。同时,本文对面向链接分析的OLAP系统的总体架构进行了设计,给出了其中各个模块的详细描述,并针对链接分析的自身特点,设计出了一种新的前端展示方式,即以对象间关系图的方式进行分析结果的展现,从而可以使读者更直观地把握整个网络结构,更好地对对象间的关系进行分析。最后,本文将面向链接分析的数据仓库及OLAP技术应用于电信领域,针对某省某移动运营商的用户群间通话数据,编码实现了一个面向链接分析的OLAP原型系统。通过该实验,不仅验证了针对表征对象间链接关系数据所提出的新存储方式的可行性,也验证了面向链接分析的OLAP技术的重要研究价值。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 论文背景
  • 1.2 论文的主要工作
  • 1.3 论文结构
  • 第二章 相关理论
  • 2.1 数据仓库概述
  • 2.1.1 数据仓库的定义及特点
  • 2.1.2 数据仓库的体系结构
  • 2.1.3 数据仓库的数据组织结构
  • 2.2 联机分析处理概述
  • 2.2.1 OLAP的定义
  • 2.2.2 OLAP的特征
  • 2.3 数据仓库与OLAP的关系
  • 2.3.1 数据仓库与OLAP的关系
  • 2.3.2 数据仓库与OLAP数据库的关系
  • 2.4 多维数据模型
  • 2.4.1 一些基本概念
  • 2.4.2 数学描述
  • 2.4.3 多维分析的基本操作
  • 2.5 小结
  • 第三章 面向链接分析的数据仓库及OLAP
  • 3.1 链接关系的存储模式
  • 3.1.1 传统的链接关系存储模式
  • 3.1.2 新的链接关系存储模式
  • 3.2 扩展的多维数据模型
  • 3.2.1 概念描述
  • 3.2.2 数学描述
  • 3.2.3 扩展的多维分析操作
  • 3.3 小结
  • 第四章 面向链接分析的OLAP系统的总体架构
  • 4.1 面向链接分析的OLAP系统的体系结构
  • 4.1.1 数据存储层
  • 4.1.2 OLAP引擎层
  • 4.1.3 展现层
  • 4.2 面向链接分析的OLAP引擎的功能体系结构
  • 4.2.1 数据立方体计算模块
  • 4.2.2 立方体物化选择模块
  • 4.2.3 数据索引模块
  • 4.2.4 查询处理模块
  • 4.2.5 元数据管理模块
  • 4.3 小结
  • 第五章 面向链接分析的OLAP原型系统的实现与应用
  • 5.1 实验场景选取
  • 5.2 实验数据准备
  • 5.3 系统实现中的相关技术简介
  • 5.3.1 JUNG简介
  • 5.3.2 复杂网络可视化中的压缩技术
  • 5.4 面向链接分析的OLAP系统关系图展示子模块的实现
  • 5.4.1 关系图展示子模块总体功能详解
  • 5.4.2 关系图展示子模块的具体实现
  • 5.5 实验及分析结果展示
  • 5.6 小结
  • 第六章 结束语
  • 6.1 总结
  • 6.2 下一步的工作
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    面向链接分析的数据仓库及联机分析处理系统的研究与应用
    下载Doc文档

    猜你喜欢