基于语义相似度的本体映射方法研究

基于语义相似度的本体映射方法研究

论文摘要

本体(Ontology)使繁杂的信息能被机器理解成为可能,为自动的信息交流处理提供了支持。但是由于语义Web分布式的特点,语义Web中的很多信息不可避免的来自于多个不同的本体。这些本体所描述的内容在语义上往往存在重叠或关联,但所使用的本体表示语言和表示模型却具有差异,这便造成了本体异构。在语义Web中,为了获取其他应用系统所拥有的信息,或者联合多个应用系统以实现更强大的功能,不同应用系统之间的信息交互非常普遍和频繁。然而,如果不同的系统采用的本体是异构的,它们之间的信息交互便无法正常进行。因此,解决本体异构、消除应用系统间的互操作障碍,是语义Web应用面临的关键问题之一解决本体异构(Ontology Heterogeneity)的通用方法是本体集成(Ontology Integration)和本体映射(Ontology Mapping)。最初,本体映射过程都是由人工完成的,但随着语义Web的发展,在网络上用本体表示的信息越来越多,仅仅由人来完成映射工作已经力不从心,因而迫切需要发展一些方法来自动地或半自动地完成映射过程。本体映射的关键是相似度的计算,虽然目前已有多种计算相似度的方法,但这些方法都有各自的缺点。本文在研究和分析了已有映射方法的基础上,对中文本体映射问题进行了研究,主要的研究工作包括:(1)结合软件工程和面向对象程序设计的思想,总结了本体的构造规则,并按照本体构建的过程构建了就业管理本体,为本体映射的研究打下基础。(2)研究了知网词汇相似度的计算方法,分析了已有方法存在的问题。(3)给出了利用本体层次结构计算概念之间相似性的方法,该方法考虑了父概念、子概念和兄弟概念对概念结构相似度的影响。分别计算各个部分之间的相似度,然后对各个部分的相似度进行加权平均得到概念结构之间的整体相似度。本文给出了各部分相似度计算的具体方法。(4)给出了利用概念属性集计算概念相似度的方法,该方法通过概念所具有的属性集合的相似程度来衡量概念之间的相似度。在计算单个属性相似度时,既考虑了属性的名称,同时还考虑了属性的数据类型。(5)结合上面的各种方法,设计和实现了一个多方法综合的中文本体映射实验系统(Chinese Ontology Mapping System, COMS)。最后,对所做的工作进行总结,展望了未来所要做的工作。Web上海量的数据要求以一种能够理解数据语义的方式进行交换和管理,当前基于HTML的Web技术却很难满足要求。可扩展标记语言XML出现,使得用户可以根据需要制订能够反映数据内容的标签,实现数据内容和数据表现方式的分离。使传统Web上的信息内容从面向人浏览转为同时面向计算机自动处理迈出了非常重要的一步。面向计算机自动处理的前提是机器可以理解数据的内容或者说对描述了数据内容的一些概念的理解。语义Web(Semantic Web)就是一个由大量机器可以理解的数据所构成的一个分布式的体系结构,在这个体系结构中,数据之间的关系通过一些术语表达,这些术语之间又形成一种复杂的网络联系,计算机能够通过这些术语得到数据的含义,并且可以在这种联系上应用逻辑来进行推理,从而完成一些原来不能直接完成的工作。本文对语义Web构想的体系结构进行了讨论,介绍了语义Web的应用和研究现状。语义Web研究的主要目的就是扩展当前的Web,使得网络中所有信息都是具有语义的,是计算机能够理解和处理的,便于人和计算机之间的交互与合作。因而其研究的侧重点就是如何把信息表示为计算机能够理解和处理的形式,即带有语义。本体在创建这种机器可处理的Web内容中扮演着关键的角色,被认为是语义Web的关键智能技术。本文讨论了本体的概念、Web本体描述语言、介绍了本体的分类及目前广泛使用本体,并总结了本体在信息检索与集成及其网页自动分类中的应用。本体的发展和应用导致大量不同的本体的出现,它们可能覆盖相同的领域或者在覆盖的领域有重叠部分。为了不同团体能够彼此理解,需要使用共同的形式化表达,但是不可能让所有的人都对一个共同本体达成共识。所以,当同一领域中出现不同本体时映射(Mapping)的问题就出现了。本文介绍了本体映射的基本概念,总结了目前常用的映射方法并给出了对这些方法的分类,最后介绍了几个典型的本体映射工程。

论文目录

  • 1. 基于语义相似度的本体映射方法研究
  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 本体映射国内外研究现状
  • 1.3 本文的研究内容
  • 1.4 本文组织结构
  • 第2章 本体构建的相关知识
  • 2.1 本体的概念
  • 2.2 本体的建模元语
  • 2.3 本体建立的原则
  • 2.3.1 一致性原则
  • 2.3.2 完备性原则
  • 2.3.3 减少冗余原则
  • 2.4 本体建立示例——高校就业管理本体
  • 2.4.1 确定本体领域和应用范围
  • 2.4.2 复用现有的本体
  • 2.4.3 枚举本体的重要术语
  • 2.4.4 定义类和类层次
  • 2.4.5 定义类的属性
  • 2.4.6 生成实例
  • 2.5 领域本体创建过程中存在的问题
  • 第3章 本体映射概述
  • 3.1 本体异构及解决方案
  • 3.2 本体映射概述
  • 3.2.1 本体映射问题描述及定义
  • 3.2.2 本体映射模型框架
  • 3.2.3 相似度的定义
  • 3.3 目前本体映射存在问题
  • 第4章 相似度计算方法
  • 4.1 基于名称的相似度计算
  • 4.1.1 基于语法的名称相似度计算
  • 4.1.2 知网及其基于知网的语义相似度计算
  • 4.2 基于层次结构的相似度计算
  • 4.3 基于属性的概念相似度计算
  • 4.4 多策略组合方法
  • 4.5 阈值的选取
  • 第5章 实验系统的实现与分析
  • 5.1 实验系统功能介绍
  • 5.2 实验系统平台的选择
  • 5.2.1 Protege
  • 5.2.2 Jena
  • 5.3 基本算法设计
  • 5.3.1 本体特征提取方法
  • 5.3.2 基于语法的名称相似度计算过程
  • 5.3.3 基于层次结构的相似度计算过程
  • 5.3.4 基于属性的概念相似度计算过程
  • 5.4 算法实验结果分析
  • 5.4.1 实验本体
  • 5.4.2 实验结果及分析
  • 第6章 总结与展望
  • 6.1 本文主要工作
  • 6.2 下一步工作展望
  • 参考文献
  • 2. 本体的语义表示及映射问题研究
  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 语义Web的概念和起源
  • 1.3 语义Web的体系结构
  • 1.4 语义Web的应用与研究现状
  • 1.4.1 智能信息检索
  • 1.4.2 基于Agent的分布式计算
  • 1.4.3 Web Service
  • 1.4.4 企业数据管理
  • 1.5 本章小结
  • 第2章 基于本体的语义表示机制
  • 2.1 本体的起源与定义
  • 2.2 本体的功能
  • 2.3 Web本体描述语言OWL
  • 2.4 现有本体及其分类
  • 2.4.1 现有本体
  • 2.4.2 Guarino分类
  • 2.4.3 Uschold分类
  • 2.5 本体构建方法学
  • 2.5.1 Enterprise Ontology方法
  • 2.5.2 TOVE方法
  • 2.5.3 Berneras方法
  • 2.5.4 METHONTOLOGY方法
  • 2.5.5 SENSUS的方法
  • 2.6 本体的应用领域
  • 2.6.1 本体在信息检索与集成领域的应用
  • 2.6.2 本体在网页自动分类中的应用
  • 2.7 本章小结
  • 第3章 基于本体的信息集成概述
  • 3.1 信息集成的目标
  • 3.2 两种信息集成机制
  • 3.3 本体在信息集成中的角色
  • 3.4 基于本体的信息集成机制
  • 3.4.1 单一本体方法(single ontology approach)
  • 3.4.2 多本体方法(multiple ontologies approach)
  • 3.4.3 混合方法(Hybrid Approaches)
  • 3.5 本章小结
  • 第4章 本体映射相关问题
  • 4.1 本体映射概念
  • 4.2 常用的本体映射方法
  • 4.2.1 基于语法的映射方法
  • 4.2.2 基于概念实例的映射方法
  • 4.2.3 基于概念定义的映射方法
  • 4.2.4 基于概念结构的映射方法
  • 4.2.5 基于规则的映射方法
  • 4.2.6 基于统计学的映射方法
  • 4.2.7 基于机器学习的映射方法
  • 4.2.8 本体代数方法
  • 4.2.9 本体聚类方法
  • 4.3 本体映射方法的分类
  • 4.4 本体映射工程介绍
  • 4.4.1 Cupid
  • 4.4.2 COMA
  • 4.4.3 SF方法
  • 4.4.4 OntoMorph系统
  • 4.4.5 S-Match动态多维概念映射算法
  • 4.5 本章小结
  • 参考文献
  • 3. The Research of Ontology Mapping Method Based on Semantic Similarity
  • Abstract
  • Chapter 1 Introduction
  • 1.1 Research Background
  • 1.2 Research Status of Ontology Mapping in Domestic and Abroad
  • 1.3 Research Content of This Thesis
  • Chapter 2 Relative Knowledge of Construct Ontology
  • 2.1 Ontology Concept
  • 2.2 Modeling Meta of Ontology
  • 2.3 Rules of Establishment Ontology
  • 2.3.1 Consistency
  • 2.3.2 Completeness
  • 2.3.3 Reducing Redundancy Principle
  • 2.4 The Example of Ontology Building-University Employment Management
  • 2.4.1 Determining Ontology Domain and Scope of Application
  • 2.4.2 Reusing Exist Ontology
  • 2.4.3 Enumeration Important Terms of Ontology
  • 2.4.4 Defining Class and Class Level
  • 2.4.5 Defining Attributes of Class
  • 2.4.6 Creating Instance
  • 2.5 Existing Problems in Domain Ontology Creation Process
  • Chapter 3 Summary of Ontology Mapping
  • 3.1 Solutions of Ontology Heterogeneous
  • 3.2 Summary of Ontology Mapping
  • 3.2.1 The Description and Definition of Ontology Mapping
  • 3.2.2 Model Framework of Ontology Mapping
  • 3.2.3 The Definition of Similarity
  • 3.3 The Current Problems of Ontology Mapping
  • Chapter 4 Calculation Method of Similarity
  • 4.1 Semantic Similarity Calculation Based on Name
  • 4.1.1 Similarity Calculation Based on the Name
  • 4.1.2 HowNet and Similarity Calculation Based on HowNet
  • 4.2 Similarity Calculation Based on Structer
  • 4.3 Similarity Calculation Based on the Property
  • 4.4 Multi-strategy Combination Methods
  • 4.5 Threshold Selection
  • Chapter 5 The Design and Implementation of Experiment System
  • 5.1 The Function of Experimental System
  • 5.2 The Choice of Experiment System Platform
  • 5.2.1 Protege
  • 5.2.2 Jena
  • 5.3 Basic Algorithms Design
  • 5.3.1 The Method of Ontology Feature's Extraction
  • 5.3.2 The Calculation Process of Name Similarity Based on the Grammar
  • 5.3.3 The Similarity Calculation Process Based on Level Structer
  • 5.3.4 The Calculation Process of Concept Similarity based on Properties
  • 5.4 The Analysis of Experiment Results
  • 5.4.1 Experimental Ontology
  • 5.4.2 The Results and Analysis of Experiment
  • Chapter 6 Summary and Prospects
  • 6.1 The Main Work In This Thesis
  • 6.2 Outlook of Next Work
  • References
  • 4. The Summary of Research on Ontology Semantic and Ontology Mapping
  • Abstract
  • Chapter 1 Summary of Semantic Web
  • 1.1 Introduction
  • 1.2 Semantic Web and the Concept of Origin
  • 1.3 Semantic Web Architecture
  • 1.4 Semantic Web Application and Research Status
  • 1.4.1 Intelligent Information Retrieval
  • 1.4.2 Agent-Based Distributed Computing
  • 1.4.3 Web Service
  • 1.4.4 Enterprise Data Management
  • 1.5 Chapter Summarization
  • Chapter 2 Ontology Semantic Representation Mechanism
  • 2.1 The Ontology's Origin and Definition
  • 2.2 Function of Ontology
  • 2.3 Web Ontology Language OWL
  • 2.4 The Existing Ontology and Classification
  • 2.4.1 Existing Ontology
  • 2.4.2 Guarino Category
  • 2.4.3 Uschold Categories
  • 2.5 Ontology Construction Methodology
  • 2.5.1 Enterprise Ontology method
  • 2.5.2 TOVE Method
  • 2.5.3 Berneras Method
  • 2.5.4 METHONTOLOGY Method
  • 2.5.5 SENSUS Method
  • 2.6 Ontology Applications
  • 2.6.1 Ontology Applications in Information Retrieval and lintegration
  • 2.6.2 Ontology Applicalions in Page Classification
  • 2.7 Chapter Summarization
  • Chapter 3 Ontology-based Information Integration
  • 3.1 Information Integration Goal
  • 3.2 Two Information Integration Mechanism
  • 3.3 Ontology in the Role of Information Integration
  • 3.4 Ontology-Based Information Integration Mechanism
  • 3.4.1 Single Ontology Method
  • 3.4.2 Multi-Ontology Method
  • 3.4.3 Hybrid Method
  • 3.5 Chapter Summarization
  • Chapter 4 Problems Concerning Ontology Mapping
  • 4.1 Concept that Ontology Mapping
  • 4.2 Ontology Mapping Method Commonly Used
  • 4.2.1 Mapping Method Based on Syntax
  • 4.2.2 Mapping Method Based on the Concept of Examples
  • 4.2.3 Mapping Method Based on the Definition of the Concept
  • 4.2.4 Mapping Method Based on the Conceptual Structure
  • 4.2.5 Mapping Method Based on Rules
  • 4.2.6 Mapping Method Based on Statistics
  • 4.2.7 Mapping Method Based on Machine Learning
  • 4.2.8 Method Based on Ontology algebra
  • 4.2.9 Method Based on Ontology Clustering
  • 4.3 Classification As Ontology Mapping Method
  • 4.4 Introduction on Ontology Mapping Project
  • 4.4.1 Cupid
  • 4.4.2 COMA
  • 4.4.3 SF Method
  • 4.4.4 OntoMorph System
  • 4.4.5 S-Match dynamic multi-dimensional concept mapping algorithm
  • 4.5 Chapter Summarization
  • References
  • 攻读学位期间发表的学术论文和研究成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于语义相似度的本体映射方法研究
    下载Doc文档

    猜你喜欢