基于映射的本体集成方法研究

论文摘要

自从Tim-Berners Lee提出Semantic Web之后,本体的研究逐渐引起了许多人的关注,并被应用到许多领域。在信息管理领域,由于信息的异质异构导致了“信息孤岛”的问题。针对这一问题,许多研究者都提出了不少解决方案,包括如数据联邦,中间件,数据仓库以及分布式数据库等方法,但都面临着无法很好地解决语义冲突的困境。由于本体能够清晰地定义概念之间的语义关系,并能被机器所理解,所以本体被广泛应用到异质异构数据的互联互通。一般的处理方式是将各种各样的数据源转换成本体,然后将这些本体聚集在一起消除彼此间的语义上的差异,从而使得信息在各数据源间交流。在这一过程中,用“本体集成“来描述不同的本体聚集在一起的情形。对于本体集成,一种比较自然的想法是将其中参与集成的各个本体视为一个统一的整体而定义其语义。这个方法的问题在于当所集成的本体规模增大的时候,推理和阅读的复杂度也会相应地增大。本文针对这一问题,提出了一种分布式方法,即将本体集成看作各个本地本体向全局本体映射而成,本文所做的工作分述如下：（1）基于分布式解释来定义本体集成的语法和语义该分布式解释由一系列的本地解释构成,它们分别解释本体（包括全局本体）以及彼此间映射的语义。由于我们所研究的本体集成,数据会从本地本体传送到全局本体中。从这一角度讲,我们在本体集成语义的基础上重点研究了本体集成的连贯性。为了判断本体集成语义的连贯性,我们通过定义归化规则,将本体集成连贯性的判定转换成了DL本体的连贯性判定问题,以充分利用已有的Tableau推理机,比如Pellet, RacePro等,在一定程度上降低了本体集成的推理复杂度。（2）本体集成连贯下的冲突研究通过分布式解释来定义本体集成的语义,在本体集成满足连贯性的情形下处理分布式查询时会出现一种特别的现象,即当本地本体的一些概念被映射至全局本体后,原先概念之间的关系会引发全局本体的不连贯性,进而导致一些“脏数据”会被传送到全局本体中。在本文,我们用“冲突”来描述该现象。针对冲突,我们基于本体的闭包给出了一种检测与发现的方法。该方法首先计算出本地本体的闭包,然后将所有被映射的概念之间的关系包括隐含关系寻找出来,再送入到全局本体中判定是否引发其不连贯性。最后通过实验验证了这一方法的正确性和可行性。（3）本体集成不连贯性的诊断研究当本地本体映射至全局本体时,部分映射关系会导致本体集成的不连贯,此时需要寻找导致不连贯的那些映射关系。针对这一问题,本文基于本体演化的原理提出了一种对本体集成的连贯性进行诊断的方法。我们将本地本体子全局本体的映射关系看成是全局本体的新增公理,由此转换成了本体演化问问题。然后利用“信念修正”理论制定了一系列的假定（postulates）确保诊断的正确性。接着定义了semi-kernel操作对映射关系实施具体的诊断。最后用实验验证证了这一方法的可行性。（4）将前述的理论和算法应用于信息集成模型我们将本体集成的语义连贯性判定算法、冲突的检测和发现算法以及连贯性诊断算法联合起来构成了本体集成模型中的集成模块。最后还通过一个案例演示了本体集成实施的具体过程。基于本体的信息集成在许多领域都得到了应用。本文所研究的用分布式解释来定义本体集成的语法和语义,为本休集成的推理、阅读和维护提供了一个比较便利的途径。

论文目录

博士生自认为的论文创新点

摘要

ABSTRACT

1 绪论

1.1 研究背景

1.1.1 本体集成的渊源

1.1.2 分布式本体与本体集成方式

1.2 问题的提出

1.3 相关研究工作

1.3.1 分布式本体的语法与语义

1.3.2 本体语义一致性的诊断

1.3.3 分布式查询

1.4 主要研究内容

1.5 论文的组织结构

2 相关知识

2.1 本体的理论基础—描述逻辑

2.1.1 描述逻辑基础

2.1.2 描述逻辑中的推理问题

2.2 语义Web

2.2.1 RDF

2.2.2 SPARQL

2.2.3 OWL

2.3 本章小结

3 基于映射的本体集成语法与语义研究

3.1 引言

3.2 基于映射的本体集成语法

3.2.1 基于映射的本体集成的特点分析

3.2.2 本体集成语法的定义

3.3 基于映射的本体集成语义

3.3.1 分布式解释的来历

3.3.2 本体集成语义的定义

3.4 本体集成的连贯性

3.4.1 一致性与连贯性的区别及联系

3.4.2 连贯性的定义

3.4.3 分布式解释的特点

3.5 语义连贯性判定算法

3.5.1 算法的基本思想

3.5.2 归化的规则

3.5.3 连贯性判定算法

3.6 连贯性判定算法的实验验证

3.6.1 实验任务

3.6.2 实验环境

3.6.3 实验过程

3.6.4 实验结果与分析

3.7 讨论

3.8 小结

4 本体集成连贯下的冲突研究

4.1 引言

4.2 连贯下的冲突分析

4.2.1 定义

4.2.2 冲突的影响

4.3 冲突检测与发现方法

4.3.1 解决方法

4.3.2 查找概念对的隐含关系算法

4.3.3 冲突集构造算法

4.4 冲突集的应用

4.4.1 用于生成局部查询

4.5 实验及结果分析

4.5.1 实验任务

4.5.2 实验环境

4.5.3 实验过程

4.5.4 实验结果及分析

4.6 讨论

4.7 小结

5 本体集成不连贯性诊断研究

5.1 引言

5.2 本体集成的不连贯性问题分析

5.2.1 不连贯性诊断的定义

5.2.2 本体集成中不连惯性诊断的必要性

5.2.3 解决思路

5.3 基于信念修正的诊断实现方法

5.3.1 信念修正简介

5.3.2 相关定义

5.3.3 不连贯性诊断算法

5.4 诊断算法的实验验证

5.4.1 实验任务

5.4.2 实验环境

5.4.3 实验过程

5.4.4 实验结果及分析

5.5 讨论

5.6 小结

6 本体集成方法的应用研究

6.1 引言

6.2 基于本体的信息集成模型

6.2.1 本体集成和数据的互操作

6.2.2 本体集成模块功能

6.3 示例

6.4 讨论

6.5 小结

7 总结和展望

7.1 本论文所做的工作

7.2 未来进一步的工作

参考文献

攻读博士期间发表的论文、参与的研究项目

致谢

基于映射的本体集成方法研究

论文摘要

论文目录

相关论文文献

猜你喜欢