基于本体的主动数据仓库语义匹配

基于本体的主动数据仓库语义匹配

论文摘要

随着计算机网络技术、信息技术和数据仓库的持续飞速发展,出现越来越多的分布异构数据源。异构数据源的研究已有很多成果,但由于子数据库和数据仓库中各种各样的异构依然存在,数据异构仍然是数据仓库与其数据源语义匹配的一个严峻问题。一个有益的解决思路是在没有人工参与的情况下,主动数据仓库自动解决语义异构,准确识别数据语义。因此,如何提供语义匹配服务,帮助主动数据仓库解决语义问题,进一步提高主动性已成为国内外研究的热点。基于本体的主动数据仓库语义匹配可解决主动数据仓库在解释、执行主动规则和数据集成时的语义异构。使用户能够计算各个相应概念的相似度,系统不用另外的映射程序就能主动准确地集成数据,主动识别规则语义,成为名副其实的主动数据仓库。论文主要概述了异构数据和异构数据集成的发展状况,在研究背景的基础上讨论本体的理论知识及其构建、主动数据仓库的概念和相关内容。初步实现了一个基于本体的主动数据仓库语义匹配系统。根据系统的需要,按照构造本体的基本方法和实验的要求,设计了系统所需要的相应本体;算法部分在弹性匹配的基础上,提出了更加合适和精确判断匹配的概率匹配(Probability Matching,PM)方法;为了度量本体中两个类的相似度,提出了语义距离(Semantic Distance,SD)的概念并实现了具体的计算方法(包括深度距离和长度距离);然后在此基础上提出两种相似度函数:一种是长深距离计算法,一种是共享信息含量法。接着提出了项目和匹配系统的整体架构和算法的实现,最后完成了系统流程和框架结构的分析设计,并根据系统的需要测试出合适的阀值,利用各种图表比较和选择上面提出的各种算法。最后本文对系统的进一步研究工作进行了探讨。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 第一节 本文研究背景及意义
  • 第二节 国内外研究现状
  • 一、异构数据
  • 二、异构数据集成方法
  • 第三节 本文研究的主要内容、创新点和章节安排
  • 一、本文研究的主要内容
  • 二、本文的创新点
  • 三、论文章节安排
  • 第二章 本体的相关技术
  • 第一节 本体的概念
  • 一、本体的定义
  • 二、本体研究的对象及组成
  • 三、本体的分类
  • 第二节 本体构建的方法
  • 一、构建本体的语言
  • 二、构建本体的规则
  • 三、构建本体的工具
  • 四、构建本体的主要方法
  • 第三节 本体的优势
  • 第三章 当前的主动数据仓库
  • 第一节 主动数据仓库的相关技术
  • 一、主动数据仓库的组成
  • 二、主动数据仓库的特点
  • 三、主动数据仓库的关键技术
  • 第二节 主动数据仓库面临的问题
  • 一、数据集成时的语义异构
  • 二、主动规则以及过程的语义冲突
  • 第四章 构建系统内主动数据仓库中的本体
  • 第一节 主动数据仓库与本体的关系
  • 一、主动数据仓库中子数据库的结构
  • 二、主动数据仓库中子数据库模式与本体的对应关系
  • 三、主动数据仓库中子数据库模式与本体元素之间的转换规则
  • 第二节 主动数据仓库内本体的建立
  • 一、本体构建的元语
  • 二、本体建立的过程
  • 第五章 系统内相似度计算
  • 第一节 语义距离的提出
  • 一、语义距离的概念
  • 二、弹性匹配
  • 三、概率匹配
  • 第二节 语义距离算法
  • 一、长度距离
  • 二、深度距离
  • 第三节 相似度计算
  • 一、相似度的概念
  • 二、计算相似度
  • 第六章 系统实现及应用
  • 第一节 系统工作准备
  • 一、系统架构
  • 二、系统中的本体
  • 第二节 系统整体架构
  • 一、算法实现
  • 二、Cut-off 值
  • 第三节 系统算法的测试与分析
  • 第四节 系统应用
  • 第七章 总结和展望
  • 第一节 本文工作总结
  • 第二节 后续工作展望
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于本体的主动数据仓库语义匹配
    下载Doc文档

    猜你喜欢