论文题目: 空间数据仓库关键技术的研究与实现
论文类型: 博士论文
论文专业: 计算机应用技术
作者: 陈细谦
导师: 迟忠先
关键词: 空间数据仓库,空间联机分析处理,空间,动态规划,地理编码
文献来源: 大连理工大学
发表年度: 2005
论文摘要: 随着空间数据获取手段的不断丰富,已经有越来越多的空间数据存储在空间数据库、地理信息系统或其它面向对象数据库中。如何有效地利用和组织管理这些空间数据以支持空间分析和决策是一项迫切的研究任务。 传统数据仓库在处理空间数据时有很大局限,首先由于空间信息数据量比较大而且空间层次的划分比较复杂,如果将空间信息引入到维中,传统数据仓库将无法灵活地处理空间维;其次传统空间数据仓库只支持数值型度量,无法支持空间类型度量,通常把它们泛化为非空间数据进行处理,丢失了很多空间特性。 根据数据仓库的成功经验,无疑构建空间数据仓库可以解决很多传统数据仓库无法解决的难题,有效支持对空间对象的深层利用和分析,提供更加全面的决策支持。本文以大连市工商管理空间数据仓库系统和大连市基础空间信息交换平台为实际应用背景,围绕着空间数据仓库具备的特点,对空间ETL、空间区域聚集查询索引结构以及系统平台的构建及行业应用角度,对空间数据仓库进行了深入的研究。重点研究了以下内容: 1) 提出了基于地理编码和动态规划技术实现空间ETL的新方法,有效实现了空间ETL过程中空间数据和非空间数据的关联。设计了基于地理编码的空间ETL模块结构。为了提高地理编码中地址匹配的效率,引入了动态规划技术,将地址匹配问题转换为两个序列的全局匹配问题,根据初始条件和递归条件可以计算出两个字符串序列的相似分值,构造一个相似度矩阵或动态规划矩阵,根据此矩阵,通过动态规划回溯(Traceback)的方法获得字符串序列的最优匹配序列。并根据地址匹配的特点,对动态规划罚分方法进行了改进,实验证明了该方法的有效性。该方法在工商管理空间数据仓库建设中取得了较好的应用效果,并为自身系统中不包含空间数据的应用领域构建空间数据仓库,探索了可行的数据获取方法。 2) 提出了一个有效支持空间区域聚集查询的索引结构。构建空间数据仓库的代价明显高于传统数据仓库,研究有效的空间索引结构和相应算法以处理不同需求的空间查询和分析已经成为了空间数据仓库领域中的研究重点。本文借鉴aRB-tree结构在处理空间维和时间维的思想,基于aR-tree和aggregate cubetree构建了aCR-tree,实现空间维和非空间混合的区域聚集查询。其中,aggregate cubetree存储了非空间维的索引结构,aR-tree存储了空间维的索引结构,存储在aggregate cubetree节点中的指向aR-tree的指针确定了两者的关系。分析了本文提出的aCR-tree和aR-tree在时间渐进性能上的差异。通过实验,将该索引结构与基于传统技术实现的a3DR-tl℃e进行了比较,证明了该索引结构在存储空间和区域聚集查询方面的优势。 3)设计并实现了一个空间数据仓库系统原型,应用到了工商管理领域,并探索了在城市基础空间信息交换平台中的应用。在系统的实现中,基于组件GIS实现了数据仓库的空间功能扩展,其中主要包括地理编码组件、空间计算分析组件、地图展现组件;以分布式存储模式存储空间数据,将空间框架数据引入到了源数据范畴中,根据不同的需求分别存储在空间数据仓库和前端联机分析客户端中;采用数据立方体和空间聚集索引结构相互协作模式实现各类空间联机分析,充分利用了传统数据仓库成熟的建模和联机分析技术,以及空间聚集索引结构在空间层次结构上的灵活特性。同时在介绍本研究室数据仓库和GIS研究成果的基础上,介绍了空间数据仓库系统各主要模块的设计与实现方法。本文研究对其它领域的空间数据仓库建设也具有一定的借鉴意义。 综上所述,本文分别从空间ETL、空间区域聚集查询索引结构、空间数据仓库系统体系结构等方面对空间数据仓库进行了研究,在此基础上,设计并实现了一个空间数据仓库系统原型并成功应用于工商管理空间数据仓库系统和城市基础空间信息交换平台,为这些领域的决策分析和数据共享提供了有效的实现方式。关键词:空间数据仓库;空间联机分析处理;空间ETL;动态规划;地理编码
论文目录:
1 绪论
1.1 引言
1.2 论文的研究背景
1.2.1 空间数据仓库的研究现状
1.2.2 空间数据仓库的研究方向
1.3 论文的研究内容
1.3.1 应用背景
1.3.2 研究内容及论文结构
2 空间数据仓库相关理论
2.1 数据仓库技术
2.2 数据仓库ETL
2.3 组件GIS技术
2.4 空间数据仓库模型
2.4.1 空间维
2.4.2 空间度量
2.4.3 空间多维数据模型
2.5 空间数据仓库体系结构
2.5.1 数据仓库体系结构
2.5.2 空间数据仓库体系结构
2.6 空间联机分析
2.7 空间数据挖掘
3 基于地理编码和动态规划技术实现空间ETL
3.1 引言
3.2 地理编码技术
3.2.1 地理编码的意义
3.2.2 地理编码的数据组织方法
3.2.3 基于地理编码的空间ETL模块结构
3.2.4 地形图和地理编码数据库
3.2.5 数据的清洗、规范化
3.2.6 地址匹配
3.3 基于动态规划技术实现地址匹配
3.3.1 动态规划方法
3.3.2 算法描述
3.3.3 算法改进
3.3.4 示例
3.3.5 实验与比较
3.4 小结
4 有效支持空间区域聚集查询的索引结构
4.1 引言
4.2 相关工作
4.2.1 aR-tree
4.2.2 aggregate cubetree
4.2.3 aRB-tree
4.2.4 其它索引结构
4.3 一种新的空间区域聚集查询索引结构
4.3.1 aCR-tree
4.3.2 aCR_tree相关算法
4.3.3 示例
4.3.4 时间复杂度分析比较
4.3.5 实验与比较
4.4 小结
5 空间数据仓库系统的设计与实现
5.1 相关系统介绍
5.1.1 SEI DW STUDIO 2.0的实现
5.1.2 SEI GIS的实现
5.2 空间数据仓库体系结构设计
5.2.1 基于组件GIS实现空间功能
5.2.2 空间数据的分布存储模式
5.2.3 数据立方体和空间聚集索引协作模式
5.3 SEI SDW的实现
5.3.1 系统概述
5.3.2 空间ETL模块
5.3.3 空间维管理
5.3.4 空间度量管理
5.3.5 空间OLAP的实现
5.4 空间数据仓库系统的应用
5.4.1 工商管理空间数据仓库系统
5.4.2 空间基础信息交换平台
5.5 小结
6 总结与展望
6.1 总结全文
6.2 下一步工作
参考文献
攻读博士学位期间参加的科研项目和发表的学术论文
学位论文创新点摘要
致谢
大连理工大学学位论文版权使用授权书
发布时间: 2005-07-04
参考文献
- [1].空间数据挖掘的研究[D]. 周海燕.中国人民解放军信息工程大学2003
- [2].空间数据仓库中查询优化技术研究[D]. 梁银.中国矿业大学2009
标签:空间数据仓库论文; 空间联机分析处理论文; 空间论文; 动态规划论文; 地理编码论文;