面向空间数据复杂性特征的聚类分析方法研究

面向空间数据复杂性特征的聚类分析方法研究

论文摘要

随着数据获取技术的快速发展,数据呈现出多样化、海量化的发展趋势。针对空间信息的空间数据被大量收集,成为探索空间领域知识的根本途径和重要依据,迫切需要面向空间数据的空间数据挖掘技术来发现其中隐含的有用知识。作为空间数据挖掘的重要分支,空间聚类以其较强的实用性和高效性,成为相关领域的研究热点。本文在深入研究空间数据挖掘、空间聚类知识和现有方法的基础上,面向空间数据体现出的复杂性特征中的海量特征、高维特征、带障碍约束特征以及多尺度特征,研究高效的空间数据聚类分析方法。针对空间数据的海量特征,运用善于进行大规模数据聚类分析的经典K-Means算法进行聚类分析,对于其存在的k值预设及初始聚类中心随机选取导致算法准确率、效率不高的问题,利用空间数据的特点,提出一种基于最优划分的K-Means初始聚类中心选取方法,提高了海量空间数据的条件下K-Means算法进行聚类分析的运算效率和算法准确率;针对空间数据的高维特征,提出一种高效的基于模糊扩展的高维空间数据子空间聚类算法,该算法基于模糊集对确定聚类边界起决定作用的稀疏单元网格进行模糊扩展,考虑相邻网格内样本点的相关性,改善了高维数据子空间聚类不平滑、边界不明确、易产生无意义过度聚类的问题,高效进行高维空间数据的聚类分析;针对空间数据多障碍约束的特征,提出一种基于网格的带障碍约束空间数据分级聚类算法,算法继承了基于网格聚类算法的优点,能够处理任意形状的障碍物并产生任意形状的簇,同时,算法采用分级策略对考察数据集进行障碍条件下聚类分析,降低了计算样本点间障碍距离产生的算法时空复杂度,提高了障碍约束条件下空间数据聚类分析的效率;针对空间数据的多尺度特征,提出一种基于等密度线的空间数据多尺度聚类分析方法,该多尺度空间聚类算法借鉴等高线思想,利用考察样本集等密度线的天然尺度性进行尺度条件下的空间数据聚类分析。本论文面向空间数据的海量特征、高维特征、带障碍约束特征以及多尺度特征分别进行了空间聚类分析方法的研究,并通过仿真实验分别证明了方法的可行性、有效性和高效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究目的及意义
  • 1.2 国内外研究现状
  • 1.2.1 经典聚类方法
  • 1.2.2 高维空间聚类算法
  • 1.2.3 带障碍约束的空间聚类算法
  • 1.2.4 多尺度空间聚类分析方法
  • 1.3 论文主要研究内容
  • 1.3.1 大规模空间数据集聚类分析方法
  • 1.3.2 高维空间聚类算法
  • 1.3.3 带障碍约束的空间聚类算法
  • 1.3.4 多尺度空间聚类算法
  • 1.4 论文的组织结构
  • 第2章 空间数据挖掘及空间聚类
  • 2.1 空间数据挖掘相关技术
  • 2.1.1 空间数据挖掘的概念及特点
  • 2.1.2 空间数据挖掘发现的知识类型
  • 2.1.3 空间数据挖掘的体系结构
  • 2.1.4 空间数据挖掘的基本过程
  • 2.2 空间聚类相关技术
  • 2.2.1 空间聚类的概念及形式化描述
  • 2.2.2 空间聚类的基本过程
  • 2.2.3 空间聚类的基本原则
  • 2.3 空间数据及其特征
  • 2.3.1 空间数据类型
  • 2.3.2 空间数据关系
  • 2.3.3 空间数据模型
  • 2.3.4 空间数据复杂性特征
  • 2.4 本章小结
  • 第3章 基于最优划分的海量空间数据聚类方法
  • 3.1 问题的提出
  • 3.2 相关研究工作
  • 3.2.1 K-Means算法概述
  • 3.2.2 K-Means算法存在的问题
  • 3.2.3 初始聚类中心选取方法
  • 3.3 基于最优划分的K-Means初始聚类中心选取方法
  • 3.3.1 最优划分的基本方法
  • 3.3.2 递归实现最优划分
  • 3.3.3 基于最优划分的初始聚类中心选取方法
  • 3.3.4 实验及结果分析
  • 3.4 本章小结
  • 第4章 基于模糊扩展的高维空间聚类方法
  • 4.1 问题的提出
  • 4.2 相关研究工作
  • 4.2.1 高维空间数据特征
  • 4.2.2 高维空间聚类方法
  • 4.2.3 典型高维空间聚类算法
  • 4.2.4 模糊集理论
  • 4.3 基于模糊扩展的高维空间聚类算法
  • 4.3.1 网格模糊区域扩展及隶属度确定方案
  • 4.3.2 算法详细描述
  • 4.3.3 实验及结果分析
  • 4.4 本章小结
  • 第5章 基于网格的带障碍空间分级聚类方法
  • 5.1 问题的提出
  • 5.2 相关研究工作
  • 5.2.1 带障碍聚类问题描述
  • 5.2.2 障碍多边形描述及预处理
  • 5.2.3 带障碍距离计算
  • 5.3 基于网格的带障碍空间分级聚类算法
  • 5.3.1 算法思想
  • 5.3.2 算法相关定义
  • 5.3.3 算法具体过程
  • 5.3.4 实验及结果分析
  • 5.4 本章小结
  • 第6章 基于等密度线的多尺度空间聚类方法
  • 6.1 问题的提出
  • 6.2 相关研究工作
  • 6.2.1 广义尺度
  • 6.2.2 空间数据的尺度特征
  • 6.2.3 空间数据的尺度依赖
  • 6.2.4 尺度空间理论
  • 6.2.5 空间多尺度数据挖掘和聚类
  • 6.3 基于等密度线的多尺度空间聚类算法
  • 6.3.1 Di-MSSC算法思想
  • 6.3.2 Di-MSSC算法过程分析
  • 6.3.3 Di-MSSC算法描述
  • 6.3.4 实验及结果分析
  • 6.4 本章小结
  • 结论
  • 参考文献
  • 攻读博士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].面向灾害预警的空间数据概念增强[J]. 自然灾害学报 2020(05)
    • [2].空间数据系统及其标准化工作[J]. 中国航天 2020(09)
    • [3].空间数据系统及其参考体系架构[J]. 中国航天 2020(09)
    • [4].空间数据的挖掘技术及其应用研究[J]. 工程技术研究 2018(06)
    • [5].构建面向个性化服务的特大城市云空间数据中心[J]. 测绘通报 2017(02)
    • [6].分布式空间数据服务两级检索方法研究[J]. 地理与地理信息科学 2017(02)
    • [7].环球速览[J]. 卫星与网络 2017(04)
    • [8].中国GIS教育发展道路上的屏障[J]. 科教导刊(中旬刊) 2017(09)
    • [9].空间数据溯源的概念、模型与服务[J]. 地理与地理信息科学 2015(06)
    • [10].WebGIS中空间数据的可视化[J]. 城市地理 2016(20)
    • [11].基于多源农地空间数据的“两区”划定应用研究[J]. 智慧农业 2019(03)
    • [12].试析空间数据产品质量及其控制与评价[J]. 地理信息世界 2019(04)
    • [13].大数据下的空间数据挖掘分析[J]. 计算机产品与流通 2017(07)
    • [14].空间数据2.0的时代 可能是空间数据的流化[J]. 卫星与网络 2017(11)
    • [15].空间数据质量不确定语言评价研究[J]. 河南理工大学学报(自然科学版) 2016(03)
    • [16].空间数据不确定性研究进展[J]. 河南理工大学学报(自然科学版) 2016(06)
    • [17].规则驱动的空间数据质检模块设计及实现[J]. 城市勘测 2015(02)
    • [18].一种空间数据服务虚拟化描述方法[J]. 计算机应用研究 2013(11)
    • [19].面向数据成果更新的空间数据制图研究[J]. 科技资讯 2014(03)
    • [20].空间数据质量的模糊综合评价方法探讨[J]. 现代测绘 2011(03)
    • [21].英拟使用卫星支持核场区退役治理[J]. 国外核新闻 2019(12)
    • [22].融入空间数据的地图制图新途径探讨[J]. 数字技术与应用 2015(10)
    • [23].空间数据库管理系统的概念与发展趋势[J]. 产业科技创新 2019(19)
    • [24].国外空间数据的语义差异及转换方法研究[J]. 测绘科学 2014(07)
    • [25].空间数据相似性研究的若干基本问题[J]. 测绘科学技术学报 2013(05)
    • [26].空间数据系统的一种安全解决方案[J]. 载人航天 2012(02)
    • [27].空间数据在内业制图中的应用思路研究[J]. 科技资讯 2010(32)
    • [28].基于邻近域的不完备空间数据探测方法[J]. 计算机工程与应用 2009(03)
    • [29].城市基础地理信息系统数据更新研究[J]. 科技创新导报 2008(12)
    • [30].空间数据尺度转换问题研究[J]. 测绘与空间地理信息 2008(05)

    标签:;  ;  ;  ;  ;  ;  

    面向空间数据复杂性特征的聚类分析方法研究
    下载Doc文档

    猜你喜欢