海量地学数据查询优化关键技术的研究

海量地学数据查询优化关键技术的研究

论文摘要

在深入分析了地学数据特性的基础上,针对地学数据量大,访问海量地学数据时查询速度很难达到理想效果这一问题,指出对海量地学数据查询进行优化的必要性。本篇论文对表分区优化、决策树的优化、XML的优化等提高海量地学数据检索速度的关键技术进行深入的分析和研究。先从表的物理结构方面着手,在详细分析表分区的工作原理后,给出不同类型表分区的原理图和分区算法,重点研究表分区如何优化海量地学数据查询,并给出查询时间对比图,形象直观的说明分区技术在优化查询速度发挥的优势;数据挖掘提高了地理信息系统的分析能力,但需要从如此多的数据中提取有用的信息,这也对海量地学数据的查询速度提出了更高的要求。决策树是数据挖掘中经常要用到的一种技术。本文在分析决策树的原理后,指出目前采用的多种优化算法,包括ID3算法、C4.5算法和剪枝算法,在ID3算法的基础上进行适当改进,充分利用程序开发过程中编程的技巧,提高了从海量地学数据中生成决策树的效率;通过XML进行数据交换实现了地学数据共享与标准化,但是在XML格式的海量地学数据中查询速度成为瓶颈。本文通过使用二叉树索引结构来优化对XML文档的查询,达到了提高查询效率的目的。最后在.Net框架平台下,以C#语言开发了海量地学数据查询优化测试系统,将本文中研究的关键技术应用到该测试系统中,经验证均达到较为满意的优化结果。

论文目录

  • 提要
  • 第一章 绪论
  • 1.1 问题的提出
  • 1.1.1 信息爆炸与海量数据的演变
  • 1.1.2 数字地球概念的提出
  • 1.1.3 空间数据挖掘技术的发展
  • 1.2 基础地学数据库建设的现状
  • 1.2.1 数据库建设完成状况
  • 1.2.2 当前存在的问题
  • 1.3 研究的目的和意义
  • 1.3.1 地学数据的重要性
  • 1.3.2 优化地学数据的必要性
  • 1.4 目前采用的方法
  • 1.5 本文研究的内容和成果
  • 1.6 本章小结
  • 第二章 地学数据特性简介
  • 2.1 地学数据的介绍
  • 2.2 地学数据库的发展历程
  • 2.3 地学数据的特性
  • 2.4 本章小结
  • 第三章 数据库表分区
  • 3.1 表分区原理
  • 3.2 表分区类型
  • 3.3 表分区在地学中的应用
  • 3.3.1 分区步骤
  • 3.3.2 范围分区应用
  • 3.3.3 列表分区应用
  • 3.3.4 散列分区应用
  • 3.3.5 组合分区应用
  • 3.4 分区索引
  • 3.4.1 本地域索引
  • 3.4.2 全局域索引
  • 3.5 分区维护
  • 3.5.1 增加分区
  • 3.5.2 删除分区
  • 3.5.3 截断分区
  • 3.5.4 拆分分区
  • 3.5.5 合并分区
  • 3.5.6 移动分区
  • 3.6 本章小结
  • 第四章 决策树的优化
  • 4.1 决策树算法概述
  • 4.1.1 决策树的基本概念
  • 4.1.2 决策树的基本算法
  • 4.2 决策树的优化算法
  • 4.2.1 优化算法概述
  • 4.2.2 ID3 算法
  • 4.2.3 C4.5 算法
  • 4.2.4 剪枝算法
  • 4.3 基于决策树算法的改进
  • 4.3.1 基于算法的优化
  • 4.3.2 基于程序的优化
  • 4.3.3 数据及属性条件的优化
  • 4.4 算法效果比较
  • 4.5 本章小结
  • 第五章 XML优化
  • 5.1 XML概述
  • 5.1.1 XML介绍
  • 5.1.2 XML的优点
  • 5.2 地学数据库与XML的转换
  • 5.2.1 关系数据库与XML的转换原理
  • 5.2.2 地学数据库与XML的转换示例
  • 5.2.3 XML文档的树型表示
  • 5.3 XML查询优化
  • 5.3.1 二叉树概述
  • 5.3.2 二叉树索引在XML中的应用
  • 5.4 本章小结
  • 第六章 程序与实现
  • 6.1 总体设计
  • 6.2 具体功能实现
  • 6.2.1 表分区测试
  • 6.2.2 决策树优化的具体实现
  • 6.2.3 XML优化的具体实现
  • 6.3 决策树部分代码
  • 6.4 本章小结
  • 第七章 结论与展望
  • 7.1 主要成果与创新
  • 7.2 展望
  • 参考文献
  • 攻博期间发表的学术论文及其它成果
  • 致谢
  • 摘要
  • Abstract
  • 相关论文文献

    • [1].区块链技术在地学数据共享中的应用可行性分析[J]. 遥感技术与应用 2020(04)
    • [2].多元地学数据的可视化分析[J]. 西部探矿工程 2016(12)
    • [3].地质地学数据模型及数据融合技术探究[J]. 广东科技 2014(22)
    • [4].地学数据本体研究与发展思考[J]. 河南师范大学学报(自然科学版) 2017(06)
    • [5].公益性地学数据的功效:拉动商业性矿产勘查[J]. 地质通报 2009(Z1)
    • [6].地学数据本体支持下的科学数据集成方法[J]. 中国科技资源导刊 2017(06)
    • [7].面向应用的多源地学数据集成管理方案初探[J]. 物探化探计算技术 2010(04)
    • [8].“地学数据分析”课程实验教学体会[J]. 中国地质教育 2008(03)
    • [9].解决地学数据发现中语义冲突的一种方案[J]. 科研信息化技术与应用 2008(01)
    • [10].面向共享的地学数据资源整合集成内涵及其技术框架初探[J]. 科研信息化技术与应用 2009(04)
    • [11].基于本体的地学数据建库方法[J]. 中国科技资源导刊 2017(05)
    • [12].地理空间数据来源本体及其在数据关联中的应用[J]. 地球信息科学学报 2017(10)
    • [13].荷兰《地学数据库》(GeoBase)2010年收录中国期刊名单[J]. 成都理工大学学报(自然科学版) 2011(03)
    • [14].基于ArcPy的地学数据自动化处理与分析方法[J]. 科技创新与生产力 2018(03)
    • [15].基于混合过滤的地学数据个性化推荐方法设计与实现[J]. 地理研究 2018(04)
    • [16].MapGIS地学数据和符号库的ArcGIS转换方案[J]. 国土资源遥感 2015(04)
    • [17].多元地学数据GIS集成技术的初步研究——以江西宜丰地区为例[J]. 科技创业家 2014(06)
    • [18].天山西部云杉林生物量与遥感地学数据相关性分析[J]. 新疆农业科学 2011(08)
    • [19].矿产地质志数据模型应用技术研究[J]. 地质学刊 2017(03)
    • [20].面向发生的地学数据分类方案及其元数据扩展研究[J]. 地理信息世界 2010(04)
    • [21].青海省基础地学数据库的建设成果及建议[J]. 黄金 2019(05)
    • [22].时间本体及其在地学数据检索中的应用[J]. 地球信息科学学报 2015(04)
    • [23].地质科学数据集成与共享服务[J]. 国土资源信息化 2015(03)
    • [24].地学数据共享网用户Web行为预测及数据推荐方法[J]. 地球信息科学学报 2017(05)
    • [25].顾及语义的地上下无缝集成多尺度建模方法[J]. 东北大学学报(自然科学版) 2010(09)
    • [26].三维地质模型在泰安市地下空间开发中的应用[J]. 山东国土资源 2014(05)
    • [27].黔西南戈塘地区多元信息综合找矿方法研究[J]. 矿产与地质 2020(03)
    • [28].论地球数据科学与共享[J]. 国土资源信息化 2015(01)
    • [29].地学数据标注和引用现状与存在的问题初探[J]. 遥感技术与应用 2016(06)
    • [30].三维多元地学数据一体化显示框架设计[J]. 计算机工程与应用 2008(19)

    标签:;  ;  ;  ;  

    海量地学数据查询优化关键技术的研究
    下载Doc文档

    猜你喜欢