异构信息集成环境中基于语义的查询研究

异构信息集成环境中基于语义的查询研究

论文摘要

随着计算机技术的发展和数据库的广泛应用,基于多种异构数据源的互操作需求越来越多。由此上世纪90年代人们提出了多数据库等结构化信息集成框架,然而近十年来,网络中可供利用的信息总量以惊人的速率增长,另一方面应用需求的变化表现得更加频繁,面对海量的信息和不断变化的应用需求,结构化集成方案表现出一定的局限性。主要表现在对信息语义无法实现机器处理,集成过程复杂、自动化程度低,无法适应新一代应用的需求。传统的多数据库信息集成方案需要手工建立从局部信息空间到全局信息空间各级模式间的映射,互操作的共享语义也没有形式化,部分语义依然以代码逻辑的形式呈现,从系统论的角度来说集成系统未来可能需要集成为更大的超系统,这些代码逻辑依然会成为集成的障碍。针对这些问题提出了一种基于本体映射的语义异构信息源集成框架(HISIM),该集成方法针对动态的应用需求自动合成互操作共享语义,实现集成过程的高度自动化,更加符合当前实际应用的需要。本体作为一种有效的语义建模方法,在智能信息集成领域得到广泛的关注和应用。互操作信息源间缺失的语义和信息源应用系统中蕴涵的代码逻辑语义都需要一种声明式的、形式化的描述。为了在不同本体之间构建代数系统来解决异构信息集成中的语义冲突,提高信息集成的正确性、一致性和有效性,给出了本体的形式化定义和代数结构描述。鉴于XML已成为互连网上事实上的数据交换标准,给出了基于XML的本体表示和概念的检索方法。在给出了本体的分类及全局本体、用户本体、局部本体的定义后,根据一个具体的实例给出了局部本体到全局本体的映射规则,该方法具有一定的普适性,转换规则通常以一种机器可识别和处理的方式表达,可以提高集成工作的智能化、自动化程度。通过模拟人类记忆和联想的生理特点,给出了全局本体的语义关联模型;基于全局本体的语义关联模型,利用语义知识单元间纵横向语义关联实现了语义知识单元的查询,并给出了具体的算法,由此可以检索互操作局部本体间的相关本体,依据相关本体、局部本体和全局本体给出了用户本体的合成算法,用于用户本体的生成。查询处理是根据查询计划进行调度,并通过查询处理操作完成中间结果组装的过程,查询处理操作主要由全局查询涉及的所有场地间运算来完成。通过分析本体映射语义给出了查询处理的类型和转换规则,提出了一种连接树结构来表达集成系统的查询处理操作,并对其进行规范化处理。通过引入查询图的概念,将连接规范树转换为等价的查询图,供后查询处理调度使用,并给出了基于查询图的查询处理多级并发调度算法,以尽可能提高查询处理执行的并发性。在分析了影响查询处理优化的代价参数后,给出了局部数据源代价和通信代价的估计方法。笛卡儿积往往是查询处理中开销最大的运算,会产生大量的无效元组,应尽量避免,以场地间连接和外连接运算组成的查询图为基础,给出了一种基于线性序列的静态优化算法LOS和一种基于统计推理的动态优化方法SRD,并通过实验仿真的方法对它们的优化性能进行了实验分析和性能比较,实验结果验证了它们的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 1 引言
  • 1.1 研究背景
  • 1.2 存在的问题
  • 1.3 国内外研究现状
  • 1.4 论文的研究内容和组织结构
  • 2 分布异构信息互操作模型
  • 2.1 互操作问题概述
  • 2.2 分布异构信息互操作中的模型集成
  • 2.3 传统多数据库系统互操作模型
  • 2.4 基于本体语义的互操作模型
  • 2.5 本章小结
  • 3 本体语义模型及基于 XML 的表示
  • 3.1 本体语义模型
  • 3.2 基于XML 的本体表示及概念检索
  • 3.3 XML 的语义扩展能力
  • 3.4 本章小结
  • 4 HISIM 框架中本体语义的处理
  • 4.1 HISIM 集成框架本体分类
  • 4.2 全局-局部本体映射
  • 4.3 全局本体语义关联模型
  • 4.4 基于语义关联模型的本体查询
  • 4.5 用户本体的合成
  • 4.6 本章小结
  • 5 基于本体映射语义的查询处理调度
  • 5.1 查询处理概述
  • 5.2 查询处理体系
  • 5.3 基于本体映射语义的查询处理操作分类
  • 5.4 查询处理调度基础
  • 5.5 查询处理的并发调度原理
  • 5.6 本章小结
  • 6 基于代价的查询处理优化
  • 6.1 查询处理优化的代价参数
  • 6.2 查询处理静态优化算法
  • 6.3 查询处理动态优化策略
  • 6.4 查询处理优化性能评价
  • 6.5 本章小结
  • 7 总结与展望
  • 7.1 全文总结
  • 7.2 进一步的研究
  • 致谢
  • 参考文献
  • 附录 1 攻读学位期间发表论文目录
  • 相关论文文献

    • [1].基于异构信息网络嵌入的专利技术主体间交易推荐模型[J]. 情报学报 2020(01)
    • [2].基于异构信息网络表征学习的推荐方法[J]. 现代计算机 2020(04)
    • [3].半监督元路径的异构信息网络社区发现算法[J]. 小型微型计算机系统 2020(06)
    • [4].异构信息网络推荐研究进展[J]. 情报科学 2020(06)
    • [5].异构信息空间中时间感知的查询时实体识别与数据融合[J]. 计算机科学 2017(03)
    • [6].异构信息空间中时间感知的跨类型实体推荐[J]. 计算机科学 2017(05)
    • [7].知识发现中异构信息标准化处理研究——以资源环境领域文献为例[J]. 图书情报工作 2016(06)
    • [8].异构信息网挖掘:概念、技术与未来[J]. 智能计算机与应用 2016(06)
    • [9].异构信息网络中基于图的半监督学习[J]. 小型微型计算机系统 2017(10)
    • [10].基于特征子图的异构信息网络节点相似性度量[J]. 电信科学 2014(11)
    • [11].多异构信息网络融合的在线学习资源推荐[J]. 实验室研究与探索 2020(09)
    • [12].异构信息网络的分类研究[J]. 计算机应用与软件 2014(06)
    • [13].一种基于概念逻辑树的异构信息结构化描述模型[J]. 通信技术 2019(11)
    • [14].一种基于嵌入技术的异构信息网络的快速聚类算法[J]. 电子与信息学报 2015(11)
    • [15].公安交通多源异构信息的采集技术分析[J]. 中国交通信息化 2014(03)
    • [16].在线交互空间异构信息的设计与实现[J]. 地理空间信息 2014(01)
    • [17].基于排名分布的异构信息网络协同聚类算法[J]. 小型微型计算机系统 2014(11)
    • [18].异构信息网络中基于元结构的协同过滤算法[J]. 计算机科学 2019(S1)
    • [19].嵌入技术的动态异构信息网络的演化聚类[J]. 哈尔滨工程大学学报 2015(05)
    • [20].基于查询—文档异构信息网络的半监督学习[J]. 通信学报 2014(08)
    • [21].异构信息知识挖掘与可视化分析系统架构模型解析[J]. 中国科技论坛 2012(10)
    • [22].基于异构信息网络的分类算法[J]. 计算机工程与设计 2019(02)
    • [23].异构信息网络概率模型研究及社区发现算法[J]. 现代计算机(专业版) 2016(04)
    • [24].云计算环境下异构信息的发现机制与管理方法研究[J]. 商场现代化 2011(23)
    • [25].基于异构信息融合的广告响应预测方法[J]. 中国科学:信息科学 2019(01)
    • [26].异构信息网上的可达性查询[J]. 计算机研究与发展 2016(02)
    • [27].一种融合异构信息网络和评分矩阵的推荐新算法[J]. 计算机研究与发展 2014(S2)
    • [28].融合异构信息的网络视频在线半监督分类方法[J]. 西安交通大学学报 2013(07)
    • [29].地质资料多元异构信息的统一化描述[J]. 中国矿业 2013(09)
    • [30].基于传播概率矩阵的异构信息网络表示学习[J]. 浙江大学学报(工学版) 2019(03)

    标签:;  ;  ;  ;  ;  

    异构信息集成环境中基于语义的查询研究
    下载Doc文档

    猜你喜欢