非结构化网络空间信息智能搜索与服务研究

非结构化网络空间信息智能搜索与服务研究

论文摘要

非结构化数据占据了网络信息资源的大部分内容,它是网络搜索引擎的主要数据来源和研究对象。非结构化空间数据是网络信息资源的重要组成部分,研究非结构化网络空间信息智能搜索与服务是通用搜索引擎在空间信息领域提供专业化信息服务的主要研究内容。它是搜索引擎技术与WebGIS等技术相结合的产物,可以为普通用户提供本地信息服务(Local Service)和空间信息检索工具,符合当今信息检索技术朝着智能化、个性化方向发展的潮流。 作为“863”项目“空间信息智能网络搜索技术”的延续,本文以网络搜索引擎技术为基础,结合自然语言处理、GIS和信息提取等技术,对非结构化Web空间信息的智能获取、加工、服务方法进行了深入、系统的研究和实践。按照文本粒度的大小,本文分别在词、句、篇、篇层等层面上研究了空间命名实体的识别、空间语义分析、空间概念提取、锚文本层次结构语义索引等关键技术。利用这些技术,本文设计实现了地图网页搜索系统、“词虎”搜索器及“文图智通”的原型系统,并将这些技术和方法融入到非结构化Web空间信息智能搜索与服务系统(SIISE)的设计和实现中,初步构造出一个完整的空间信息搜索系统雏形。具体说来,主要开展了以下研究工作: [1] 研究了海量空间命名实体(SNE)在线识别问题。在分析一般命名实体识别方法的基础上,提出利用SNE的空间特性、采用地理编码的手段在线识别单句、全文中SNE的技术思想。对于单句,利用基础地名词典进行切词,通过编码分析和SNE单元合并的策略进行识别;对于全文,利用全文粗扫描获取相关的地理编码,通过编码分析锁定文中涉及的空间范围,然后按照一定的策略自动加载匹配词典识别文中其它SNE。实验表明,这种方法能识别出大量在词典中不存在的组合式SNE,系统具备一定的自适应性,较好地解决了因命名实体词典数量庞大而导致的低效率问题。 [2] 研究了自然语言中的空间语义分析与空间概念提取方法。根据汉语表达空间概念的特点以及GIS表征空间信息的特点定义了空间语义角色,并利用空间语义角色定义了空间概念的形式化描述方法,提出了利用空间语义角色分析自然语言中的空间语义和空间概念基本思路。方法是:先构造空间语义词典,采用浅层句法分析的原理,通过空间语义角色标注、短语识别以及概念模式匹配等手段提取了文本中的空间概念。初步实验显示,该方法具有较好的准确率,召回率还有待提高。 [3] 探索了锚文本层次结构语义索引检索机制。在深入剖析锚文本的特征以

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 基本概念
  • 1.2 研究背景
  • 1.3 研究进展
  • 1.3.1 研究现状
  • 1.3.2 存在问题
  • 1.4 论文概述
  • 1.4.1 选题意义
  • 1.4.2 研究内容及目标
  • 1.4.3 技术路线
  • 1.4.4 组织结构
  • 第二章 相关技术基础
  • 2.1 信息检索模型
  • 2.2 倒排索引技术
  • 2.3 链接分析技术
  • 2.4 中文分词技术
  • 2.5 GIS数据组织与管理
  • 2.6 性能评价指标
  • 2.7 小结
  • 第三章 海量空间命名实体的在线识别
  • 3.1 空间命名实体概念、特点
  • 3.2 命名实体识别方法简述
  • 3.3 单句在线识别
  • 3.3.1 词典的组织
  • 3.3.2 SNE地理编码
  • 3.3.3 索引及Hash算法
  • 3.3.4 识别方法
  • 3.3.5 示例
  • 3.4 全文在线识别
  • 3.4.1 相关定义
  • 3.4.2 算法描述
  • 3.4.3 识别流程
  • 3.4.4 预处理与规则提取
  • 3.4.5 SNE识别
  • 3.4.6 后处理
  • 3.5 结果评估
  • 3.6 应用实例
  • 3.6.1 “词虎”搜索器
  • 3.6.2 文图智通
  • 3.6.3 智能地址匹配设计
  • 3.7 小结
  • 第四章 基于空间语义角色的空间概念提取
  • 4.1 基本概念
  • 4.2 研究现状
  • 4.3 空间语义角色及空间概念表达
  • 4.4 提取方法
  • 4.4.1 基本流程
  • 4.4.2 空间语义词典
  • 4.4.3 标注
  • 4.4.4 短语分析
  • 4.4.5 识别文法
  • 4.4.6 概念提取
  • 4.5 初步实验结果
  • 4.6 应用分析
  • 4.6.1 地理本体实例搜索
  • 4.6.1.1 地理本体描述
  • 4.6.1.2 实例定位语言
  • 4.6.1.3 实例识别语法
  • 4.6.1.4 本体实例提取
  • 4.6.1.5 实例查询
  • 4.6.2 其它应用
  • 4.7 小结
  • 第五章 锚文本层次结构语义索引检索机制
  • 5.1 相关工作
  • 5.1.1 锚文本特征分析
  • 5.1.2 语义索引
  • 5.1.3 隐性语义索引
  • 5.2 网站信息表征
  • 5.2.1 信息的表征性
  • 5.2.2 网站信息表征
  • 5.2.3 网站锚文本层次结构语义
  • 5.3 索引机制
  • 5.3.1 基本思想
  • 5.3.2 锚文本层次结构树构建
  • 5.3.3 编码方法
  • 5.3.4 索引过程
  • 5.4 检索方法
  • 5.5 RDF/RDFS描述及应用扩展
  • 5.6 小结
  • 第六章 地图网页的搜索
  • 6.1 搜索方式的确定
  • 6.2 地图网页特征与判别
  • 6.3 视图特性及参数估算
  • 6.4 识别算法描述
  • 6.5 系统架构
  • 6.6 实现方法
  • 6.6.1 网页元搜索
  • 6.6.2 URL检索入口
  • 6.6.3 预处理
  • 6.6.4 网页识别
  • 6.6.4.1 关键词集
  • 6.6.4.2 网页识别
  • 6.6.5 检索
  • 6.7 实验与讨论
  • 6.8 小结
  • 第七章 空间信息智能搜索引擎原型设计与实现
  • 7.1 设计思想
  • 7.2 系统框架及流程
  • 7.3 系统实现
  • 7.3.1 网页搜集
  • 7.3.1.1 DNS缓存
  • 7.3.1.2 启发式搜索
  • 7.3.1.3 URL过滤
  • 7.3.1.4 共享URL队列
  • 7.3.1.5 域名库
  • 7.3.1.6 数据存储
  • 7.3.1.7 监视器
  • 7.3.2 特征分析与索引
  • 7.3.2.1 预处理
  • 7.3.2.2 分词及空间特征提取
  • 7.3.2.3 索引
  • 7.3.3 检索服务
  • 7.3.3.1 检索流程
  • 7.3.3.2 相关度计算
  • 7.3.3.3 结果显示及日志处理
  • 7.4 小结
  • 第八章 总结与展望
  • 8.1 本文总结
  • 8.2 本文创新点
  • 8.3 研究展望
  • 参考文献
  • 本文缩写名称对照
  • 图索引
  • 表索引
  • 参与科研情况简介
  • 读博期间发表论文情况
  • 致谢
  • 相关论文文献

    • [1].基于分层、分域控制的空间信息网络体系结构研究[J]. 中国电子科学研究院学报 2019(11)
    • [2].推动空间信息产业创新发展[J]. 网信军民融合 2019(12)
    • [3].空间信息产业边界和层次分析[J]. 卫星应用 2020(04)
    • [4].基于虚拟化的空间信息网络资源管理机制研究[J]. 中国电子科学研究院学报 2018(05)
    • [5].以自我为中心的电子地图空间信息组织与可视化[J]. 测绘地理信息 2017(01)
    • [6].关于空间信息产业与我国空间信息产业发展的若干认识[J]. 卫星应用 2017(03)
    • [7].空间信息网络引力模型设计与分析[J]. 系统科学与数学 2014(10)
    • [8].论我国空间信息网络的构建[J]. 武汉大学学报(信息科学版) 2015(06)
    • [9].空间信息网络的构建分析[J]. 电脑迷 2017(03)
    • [10].基础空间信息成长型元数据的研究与设计[J]. 测绘与空间地理信息 2013(12)
    • [11].面向空间信息与数字技术专业的数据库课程建设探索[J]. 教育现代化 2019(97)
    • [12].钱学森智库聚焦空间信息产业创新发展——第十九期钱学森论坛在长沙成功举办[J]. 网信军民融合 2019(12)
    • [13].空间信息网络资源预留允许控制的方法[J]. 空间电子技术 2016(06)
    • [14].面向空间信息的数据通信协议的设计与实现[J]. 计算机工程与设计 2017(02)
    • [15].浅谈空间信息对抗技术发展趋势[J]. 科技风 2013(24)
    • [16].空间信息相关专业面向对象程序设计教学研究[J]. 电脑知识与技术 2013(22)
    • [17].网格化管理系统中的空间信息公共服务平台研究[J]. 科技创新导报 2011(32)
    • [18].空间信息共享与服务的新趋势[J]. 地理信息世界 2009(04)
    • [19].地质空间信息元数据服务模式的实现[J]. 地质通报 2008(05)
    • [20].基于遥感大数据的应急管理空间信息智能提取[J]. 卫星应用 2020(06)
    • [21].发展空间信息技术,助推智慧社会建设——智慧社会与空间信息学术研讨会成功召开[J]. 卫星应用 2019(02)
    • [22].开展空间信息服务建设 助力“一带一路”实施——广西空间信息应用服务体系建设综述[J]. 卫星应用 2018(03)
    • [23].期刊博览[J]. 中国测绘 2018(02)
    • [24].我国空间信息产业发展分析[J]. 卫星应用 2018(06)
    • [25].脑空间信息学——连接脑科学与类脑人工智能的桥梁[J]. 中国科学:生命科学 2017(10)
    • [26].空间信息网络体系验证技术研究[J]. 无线电通信技术 2016(02)
    • [27].空间信息可信度对反导指挥控制效果影响分析[J]. 飞航导弹 2016(05)
    • [28].基于分布式星群的空间信息网络体系架构与关键技术[J]. 中兴通讯技术 2016(04)
    • [29].共建空间信息走廊 助力“一带一路”[J]. 报刊荟萃 2017(03)
    • [30].论空间信息的表达[J]. 旅游纵览(下半月) 2013(14)

    标签:;  ;  ;  ;  ;  ;  ;  

    非结构化网络空间信息智能搜索与服务研究
    下载Doc文档

    猜你喜欢