云环境下图数据存储与并行聚类研究

云环境下图数据存储与并行聚类研究

论文摘要

如何实现海量空间数据高效地存储管理和在线服务,同时基于这些数据挖掘用户感兴趣、有用的地学知识,成为地学领域日益关注的热点问题。目前空间数据云存储的研究大多集中在栅格数据存储和管理等方面,而针对矢量数据云存储与云服务领域研究较为零散,同时基于云存储的空间挖掘也缺乏系统的研究。本文根据矢量和栅格空间数据的不同特点,提出并实现了矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案,并基于云存储设计与实现了一个高效的并行谱聚类挖掘算法。主要研究内容和成果如下:1.在综述云计算、NoSQL数据库与图计算等相关领域的国内外研究现状的基础上,详细阐述了空间云存储与并行聚类的基础理论。分析了云计算模式的概念和特性以及NoSQL非关系数据库技术的起源、类型,分析了图数据库的数据模型、应用场景和传统空间存储技术的实现与局限,以及不同并行计算模型的原理、适用场合以及优缺点。2.根据矢量和栅格空间数据的不同特点,提出矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案。在三层式空间数据云存储架构基础上,给出基于NoSQL数据库技术的栅格和矢量数据云存储的实现策略与方法,并开展了通用数据访问接口的设计。采用分布式文件系统HDFS存储栅格数据,并使用列族数据库HBase对其建立分布式空间索引,而采用满足ACID约束的分布式图数据库Neo4J来存储矢量数据,并使用R树建立空间索引。3.探讨了基于图论的空间聚类算法——谱聚类算法原理,通过对比分析算法中不同的子图划分方法,采用DiDiC分割算法应用于并行图数据空间聚类中。同时结合并行计算框架MapReduce,提出了空间谱聚类算法流程及其基于MapReduce并行化的实现方法。4.开展了图数据的存储以及并行聚类的两个方面的试验测试。在图数据存储方面,开展了GeoDAC与PostGIS在矢量数据读写访问性能方面的对比测试。结果表明,虽然GeoDAC没有获得写入性能的加速作用,但其具有PostGIS无法比拟的强大读取性能。在图挖掘方面,开展了并行谱聚类算法与单机版谱聚类算法在图数据的挖掘效率对比测试,证明算法并行化具有显著提升图数据挖掘算法的性能。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 立题依据
  • 1.2 研究目标与内容
  • 1.3 研究技术路线
  • 1.4 文章章节安排
  • 1.5 国内外发展状况
  • 第二章 空间数据云存储与并行聚类挖掘理论
  • 2.1 空间数据云存储概述
  • 2.1.1 云计算概述
  • 2.1.2 空间数据库
  • 2.1.3 NoSQL数据库
  • 2.1.4 图数据库
  • 2.1.5 空间索引
  • 2.2 空间数据云服务概述
  • 2.2.1 空间数据服务
  • 2.2.2 云服务
  • 2.3 并行聚类挖掘概述
  • 2.3.1 聚类挖掘概述
  • 2.3.2 并行计算概论
  • 2.3.3 并行计算模型
  • 2.4 本章小结
  • 第三章 空间数据云存储与服务
  • 3.1 栅格数据云存储
  • 3.1.1 栅格数据存储
  • 3.1.2 分布式文件系统
  • 3.1.3 分布式列族数据库
  • 3.1.4 栅格数据云存储策略
  • 3.2 矢量数据云存储
  • 3.2.1 空间对象表达与存储
  • 3.2.2 图数据库空间存储
  • 3.2.3 图数据划分
  • 3.2.4 矢量数据的云存储策略
  • 3.3 空间数据云服务
  • 3.3.1 空间数据云服务的管理
  • 3.3.2 空间数据服务的集成与应用
  • 3.4 数据聚合与知识服务中心实现
  • 3.4.1 地理知识云GeoKSCloud
  • 3.4.2 数据聚合中心GeoDAC
  • 3.4.3 知识服务中心GeoSC
  • 3.5 本章小结
  • 第四章 图数据的并行空间聚类挖掘
  • 4.1 空间聚类
  • 4.1.1 空间聚类定义
  • 4.1.2 空间聚类基本流程
  • 4.2 基于图论的空间聚类算法
  • 4.2.1 空间谱聚类算法
  • 4.3 空间谱聚类算法并行化
  • 4.3.1 MapReduce框架
  • 4.3.2 并行化谱聚类实现
  • 4.4 本章小结
  • 第五章 应用实例分析与评价
  • 5.1 图数据测试环境
  • 5.2 图数据说明
  • 5.2.1 云存储数据说明
  • 5.2.2 聚类挖掘数据说明
  • 5.3 性能测试与分析
  • 5.3.1 图数据读写访问
  • 5.3.2 图数据聚类挖掘
  • 5.4 本章小结
  • 第六章 结论与展望
  • 参考文献
  • 致谢
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    云环境下图数据存储与并行聚类研究
    下载Doc文档

    猜你喜欢