基于语义的轻量级数据集成方法研究

基于语义的轻量级数据集成方法研究

论文摘要

随着数据库和网络技术的发展和广泛应用,数据源中的数据呈现出分布和异构的特性。企业因业务需求建立起相应的计算机处理系统,存储了大量的数据资源,这些资源彼此孤立、结构各异,从而导致了“信息孤岛”的产生。为了更好地利用这些数据资源服务于企业的决策和业务处理,需要对这些分布、异构的数据进行集成,实现数据共享。当数据源数量增多时,现有的方法的集成代价都比较高。如何利用较小的代价来解决分布、异构数据源的结构异构、语法异构和语义异构已成为目前的研究热点。本文针对现有数据集成方法存在的集成量较多、集成代价较大等不足,对基于语义的轻量级数据集成方法进行研究。文章首先介绍了数据集成中涉及的相关技术,然后给出了基于语义的轻量级数据集成框架,而后在集成框架的指导下提出了元数据的统一表示形式,并进一步给出了局部元数据识别算法、本体识别规则和全局元数据集成算法。最后,通过实验验证了所给方法的可行性。本论文主要完成了以下工作:(1)提出了一种面向轻量级数据集成的元数据格式,满足了该数据集成方法对元数据的需求。与现有的元数据相比具有以下优点:采用URL命名方式使元数据具有全局唯一性、使用RDF表示元数据使其具有语义性并提供了更加全面的数据源信息。在局部数据源中识别局部本体,并在此基础上提出了元数据抽取算法对各个局部数据源进行元数据抽取;(2)提出一种基于本体映射的元数据集成算法以及更新策略。建立了局部本体与全局本体的映射,并在局部元数据与局部本体映射及本体映射基础上提出了元数据集成算法来生成全局元数据,并通过全局元数据解决了数据源的结构、语法和语义异构的问题。文中还进一步给出了针对该数据集成算法的数据更新策略,保证了数据集成的实时性。(3)在以上理论指导下,使用相关技术,设计并实现了基于语义的轻量级数据集成系统,主要包含四个模块:本体识别模块、元数据抽取模块、本体映射模块和全局元数据集成模块。最后,文章通过查询实验证明了该方法的可行性和有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 引言
  • 1.1 研究背景与现状
  • 1.1.1 研究背景
  • 1.1.2 研究现状
  • 1.1.3 问题的提出
  • 1.2 研究目的和意义
  • 1.2.1 研究目的
  • 1.2.2 研究意义
  • 1.3 研究内容、研究思路与研究方法
  • 1.3.1 研究内容
  • 1.3.2 研究思路
  • 1.3.3 研究方法
  • 1.4 论文组织结构
  • 第2章 相关研究文献综述
  • 2.1 关于数据集成方法
  • 2.1.1 现有的集成方法
  • 2.1.2 数据集成方法比较
  • 2.2 关于元数据
  • 2.2.1 元数据的概念
  • 2.2.2 元数据在数据集成中的作用
  • 2.2.3 元数据的编码语言
  • 2.3 关于本体
  • 2.3.1 本体的概念
  • 2.3.2 本体在数据集成中的作用
  • 2.3.3 本体映射
  • 2.4 已有研究成果的贡献与不足
  • 2.4.1 主要贡献
  • 2.4.2 不足之处
  • 2.4.3 已有研究成果对本文研究的启示
  • 2.5 本章小结
  • 第3章 基于语义的轻量级数据集成框架
  • 3.1 集成框架的建立
  • 3.2 核心组件功能分析
  • 3.3 框架的工作机理
  • 3.4 本章小结
  • 第4章 带有语义的局部元数据的表示与抽取
  • 4.1 关系数据库中表的分类
  • 4.2 局部本体的识别和表示
  • 4.2.1 局部本体的识别
  • 4.2.2 局部本体的表示
  • 4.3 局部元数据的抽取和表示
  • 4.3.1 局部元数据的抽取
  • 4.3.2 局部元数据的描述
  • 4.4 局部本体与局部元数据的映射
  • 4.5 本章小结
  • 第5章 基于本体映射的元数据集成
  • 5.1 本体映射的建立
  • 5.2 元数据的集成
  • 5.2.1 元数据集成规则
  • 5.2.2 元数据集成算法
  • 5.2.3 全局元数据的表示方法
  • 5.3 全局元数据的存储
  • 5.4 元数据更新
  • 5.4.1 数据源更新情况
  • 5.4.2 元数据更新策略
  • 5.5 本章小结
  • 第6章 实验分析
  • 6.1 实验环境与开发工具简介
  • 6.2 原型系统构建
  • 6.2.1 本体识别模块
  • 6.2.2 局部元数据的抽取模块
  • 6.2.3 本体映射的建立模块
  • 6.2.4 全局元数据的生成模块
  • 6.3 原型系统应用
  • 6.4 实验结果分析
  • 6.5 本章小结
  • 第7章 结论与后期工作展望
  • 7.1 主要结论
  • 7.2 后期工作展望
  • 致谢
  • 参考文献
  • 攻读学位期间发表论文以及参加科研情况
  • 相关论文文献

    • [1].数据集成方法发展与展望[J]. 软件学报 2020(03)
    • [2].分布式过程实时数据集成方法及其实现[J]. 计算机工程 2010(03)
    • [3].基于语义的轻量级数据集成方法[J]. 计算机工程与设计 2012(01)
    • [4].结合朴素贝叶斯和欧氏距离的二类非均衡数据集成方法[J]. 信号处理 2017(04)
    • [5].面向复杂产品协同开发的数据集成方法研究[J]. 计算机科学 2009(12)
    • [6].基于中间释义库的数据集成方法研究[J]. 价值工程 2014(34)
    • [7].网格环境下基于P2P的数据集成方法[J]. 计算机工程 2009(12)
    • [8].信息系统中的数据集成方法研究与应用[J]. 微电子学与计算机 2008(05)
    • [9].基于实体资源的数据集成方法研究[J]. 计算机工程与设计 2013(08)
    • [10].基于SOA软件架构的数据集成方法[J]. 计算机应用 2010(09)
    • [11].面向高校多源异构数据环境的元数据集成方法[J]. 辽宁大学学报(自然科学版) 2019(02)
    • [12].面向三维工艺车间展示的数据集成方法研究[J]. 赤峰学院学报(自然科学版) 2018(04)
    • [13].基于语义查询接口的科研本体知识库数据集成方法研究与实现[J]. 图书馆杂志 2017(02)
    • [14].一种基于XML的装备保障数据集成方法[J]. 计算机系统应用 2011(11)
    • [15].一种以电子病历为核心的多数据库数据集成方法[J]. 中国数字医学 2013(12)
    • [16].基于ETL的工业数据集成方法设计[J]. 中国科技信息 2018(12)
    • [17].一种支持数据源动态加入的交互式数据集成方法[J]. 郑州大学学报(理学版) 2016(04)
    • [18].基于地理本体的空间数据集成方法及其实现[J]. 地理研究 2009(03)
    • [19].利用FME的小城镇规划数据集成方法[J]. 测绘科学 2012(05)
    • [20].BIM和GIS的空间语义数据集成方法及应用研究[J]. 图学学报 2020(01)
    • [21].Fog-IBDIS——基于雾计算的制造系统大数据集成方法[J]. Engineering 2019(04)
    • [22].一种基于ESB的异构系统数据集成方法[J]. 东北林业大学学报 2009(02)
    • [23].无结构化数据集成方法在数字图书馆中的应用[J]. 现代情报 2009(03)
    • [24].语义模型支持的战场环境数据集成方法[J]. 测绘科学技术学报 2019(06)
    • [25].多源异构地质数据集成方法应用研究[J]. 地质学刊 2018(01)
    • [26].解决矿山信息系统应用深层次问题的数据集成方法[J]. 现代矿业 2012(08)
    • [27].基于地理信息系统的轨道交通数据集成方法研究[J]. 都市快轨交通 2016(02)
    • [28].网格环境下分布式信息系统数据集成方法研究[J]. 广州大学学报(自然科学版) 2012(02)
    • [29].基于混合决策树的自适应数据集成方法[J]. 合肥工业大学学报(自然科学版) 2011(08)
    • [30].信息系统中的数据集成方法研究与应用分析[J]. 山东工业技术 2015(07)

    标签:;  ;  ;  

    基于语义的轻量级数据集成方法研究
    下载Doc文档

    猜你喜欢