基于γ空间划分的高维数据索引结构研究

基于γ空间划分的高维数据索引结构研究

论文摘要

传统的高维数据索引结构在维度较高的情况下,其检索效率甚至会低于最原始的顺序查找方法,即所谓的“维度灾难”。在高维数据空间,“维度灾难”现象主要是由空间划分策略引起的。空间划分的不恰当,导致索引结构的不合理,进而使其索引结构的性能下降。针对上述问题,本文做了如下工作:首先根据在高维数据空间中无效的信息在低维空间中往往无效的原理,通过采用γ划分策略沿着关键维对高维数据空间中的数据进行降维、聚类,提出了一种压缩金字塔技术;其次,给出了压缩金字塔技术的基本概念、划分策略、构造方法以及相应的点查询、范围查询、KNN查询算法;最后,通过对维度不同、数据集大小不同的真实数据进行实验,得出如下结论:压缩金字技术改善了金字塔技术在偏斜数据空间存在的“损失的空间邻接性”、“假命中”等问题,因此在高维稀疏空间进行范围查询和KNN查询时,与金字塔技术相比,具有良好的查询性能,是高维数据空间一种有效的高维索引结构。

论文目录

  • 摘要
  • Abstract
  • 1 引言
  • 1.1 研究背景和意义
  • 1.2 国内外研究现状
  • 1.3 研究目标及主要贡献
  • 1.3.1 研究目标
  • 1.3.2 主要贡献
  • 1.4 论文结构及主要内容
  • 2 高维数据索引结构的理论基础
  • 2.1 引言
  • 2.2 高维数据及其索引结构特点
  • 2.2.1 高维数据特点
  • 2.2.2 高维数据索引结构特点
  • 2.2.3 “维数灾难”现象的产生
  • 2.3 高维数据查询方式
  • 2.3.1 相似性度量
  • 2.3.2 高维数据库的查询方式
  • 2.4 向量空间高维索引结构
  • 2.4.1 向量空间高维索引结构分类
  • 2.4.2 KDB-Tree
  • 2.4.3 R-Tree 及其变种
  • 2.4.4 量化近似类
  • 2.4.5 金字塔技术
  • 2.4.6 聚类金字塔技术
  • 2.5 度量空间高维索引结构
  • 2.5.1 度量空间高维索引结构分类
  • 2.5.2 BK-Tree
  • 2.5.3 M-Tree
  • 2.5.4 SLIM-Tree
  • 2.5.5 VP-Tree
  • 2.5.6 向量空间与度量空间索引结构异同点
  • 2.6 小结
  • 3 压缩金字塔技术
  • 3.1 引言
  • 3.2 压缩金字塔的基本概念
  • 3.3 γ空间划分的过程
  • 3.3.1 关键维的选择
  • 3.3.2 γ空间划分的过程
  • 3.3.3 γ空间的标识
  • 3.4 压缩金字塔技术的基本操作
  • 3.4.1 压缩金字塔的构造
  • 3.4.2 插入操作
  • 3.4.3 删除操作
  • 3.5 压缩金字塔技术的查询操作
  • 3.5.1 点查询
  • 3.5.2 范围查询
  • 3.5.3 KNN 查询
  • 3.6 小结
  • 4 压缩金字塔技术性能分析
  • 4.1 引言
  • 4.2 索引结构性能分析
  • 4.2.1 理论分析
  • 4.2.2 实验分析
  • 4.3 检索性能分析
  • 4.3.1 点查询性能对比
  • 4.3.2 范围查询性能对比
  • 4.3.3 KNN 查询性能对比
  • 4.4 小结
  • 5 结论
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文及参加科研工作
  • 相关论文文献

    • [1].基于分层索引的高维数据对象检索[J]. 指挥信息系统与技术 2019(06)
    • [2].高维数据的交互式沉浸可视化——以城市生活质量数据为例[J]. 装饰 2019(06)
    • [3].基于大数据的高维数据挖掘探究[J]. 通讯世界 2018(03)
    • [4].智能电网中高维数据聚类方法研究[J]. 智能计算机与应用 2016(01)
    • [5].浅谈高维数据变量选择现状与方法[J]. 数码世界 2016(07)
    • [6].高维数据流异常节点动态跟踪仿真研究[J]. 计算机仿真 2020(10)
    • [7].基于高维数据流的异常检测算法[J]. 计算机工程 2018(01)
    • [8].大数据环境下的高维数据挖掘在入侵检测中的有效应用[J]. 电脑编程技巧与维护 2016(22)
    • [9].一种高维数据流的稳健监控方法[J]. 天津职业技术师范大学学报 2016(02)
    • [10].基于大数据的高维数据挖掘研究[J]. 信息与电脑(理论版) 2015(15)
    • [11].浅谈高维数据挖掘的现状与方法[J]. 福建电脑 2014(07)
    • [12].高维数据空间的一种网格划分方法[J]. 计算机工程与应用 2011(05)
    • [13].面向精细农业的高维数据本征维数估计方法研究进展[J]. 中国科学:信息科学 2010(S1)
    • [14].数学建模中的高维数据挖掘技术优化研究[J]. 计算机测量与控制 2017(09)
    • [15].采用高维数据聚类的目标跟踪(英文)[J]. 红外与激光工程 2016(04)
    • [16].非规则流中高维数据流典型相关性分析并行计算方法[J]. 软件学报 2012(05)
    • [17].基于控制过度遗漏发现概率的高维数据流异常诊断[J]. 数理统计与管理 2020(03)
    • [18].相关高维数据流在线监控方法研究[J]. 天津职业技术师范大学学报 2016(03)
    • [19].高维数据挖掘技术在教学质量监控与评价的应用研究[J]. 全国商情(理论研究) 2010(11)
    • [20].一种高维数据聚类遗传算法[J]. 计算机工程与科学 2010(08)
    • [21].基于联合树的隐私高维数据发布方法[J]. 计算机研究与发展 2018(12)
    • [22].基于正则化回归的变量选择方法在高维数据中的应用[J]. 实用预防医学 2018(06)
    • [23].一种支持高维数据查询的并行索引机制[J]. 华中科技大学学报(自然科学版) 2011(S1)
    • [24].矩阵奇异值分解及其在高维数据处理中的应用[J]. 数学的实践与认识 2011(15)
    • [25].高维数据变量选择方法综述[J]. 数理统计与管理 2017(04)
    • [26].高维数据空间索引方法的研究[J]. 电脑知识与技术 2009(16)
    • [27].基于聚类融合算法的高维数据聚类的研究[J]. 电子测量技术 2008(04)
    • [28].高维数据固有维数的自适应极大似然估计[J]. 计算机应用 2008(08)
    • [29].基于超网络和投影降维的高维数据流在线分类算法[J]. 计算机应用与软件 2020(10)
    • [30].面向高维数据的安全半监督分类算法[J]. 计算机系统应用 2019(05)

    标签:;  ;  ;  ;  ;  ;  

    基于γ空间划分的高维数据索引结构研究
    下载Doc文档

    猜你喜欢