论文摘要
本体(Ontology)使繁杂的信息能被机器理解成为可能,为自动的信息交流处理提供了支持。但是由于语义Web分布式的特点,语义Web中的很多信息不可避免的来自于多个不同的本体。这些本体所描述的内容在语义上往往存在重叠或关联,但所使用的本体表示语言和表示模型却具有差异,这便造成了本体异构。在语义Web中,为了获取其他应用系统所拥有的信息,或者联合多个应用系统以实现更强大的功能,不同应用系统之间的信息交互非常普遍和频繁。然而,如果不同的系统采用的本体是异构的,它们之间的信息交互便无法正常进行。因此,解决本体异构、消除应用系统间的互操作障碍,是语义Web应用面临的关键问题之一解决本体异构(Ontology Heterogeneity)的通用方法是本体集成(Ontology Integration)和本体映射(Ontology Mapping)。最初,本体映射过程都是由人工完成的,但随着语义Web的发展,在网络上用本体表示的信息越来越多,仅仅由人来完成映射工作已经力不从心,因而迫切需要发展一些方法来自动地或半自动地完成映射过程。本体映射的关键是相似度的计算,虽然目前已有多种计算相似度的方法,但这些方法都有各自的缺点。本文在研究和分析了已有映射方法的基础上,对中文本体映射问题进行了研究,主要的研究工作包括:(1)结合软件工程和面向对象程序设计的思想,总结了本体的构造规则,并按照本体构建的过程构建了就业管理本体,为本体映射的研究打下基础。(2)研究了知网词汇相似度的计算方法,分析了已有方法存在的问题。(3)给出了利用本体层次结构计算概念之间相似性的方法,该方法考虑了父概念、子概念和兄弟概念对概念结构相似度的影响。分别计算各个部分之间的相似度,然后对各个部分的相似度进行加权平均得到概念结构之间的整体相似度。本文给出了各部分相似度计算的具体方法。(4)给出了利用概念属性集计算概念相似度的方法,该方法通过概念所具有的属性集合的相似程度来衡量概念之间的相似度。在计算单个属性相似度时,既考虑了属性的名称,同时还考虑了属性的数据类型。(5)结合上面的各种方法,设计和实现了一个多方法综合的中文本体映射实验系统(Chinese Ontology Mapping System, COMS)。最后,对所做的工作进行总结,展望了未来所要做的工作。Web上海量的数据要求以一种能够理解数据语义的方式进行交换和管理,当前基于HTML的Web技术却很难满足要求。可扩展标记语言XML出现,使得用户可以根据需要制订能够反映数据内容的标签,实现数据内容和数据表现方式的分离。使传统Web上的信息内容从面向人浏览转为同时面向计算机自动处理迈出了非常重要的一步。面向计算机自动处理的前提是机器可以理解数据的内容或者说对描述了数据内容的一些概念的理解。语义Web(Semantic Web)就是一个由大量机器可以理解的数据所构成的一个分布式的体系结构,在这个体系结构中,数据之间的关系通过一些术语表达,这些术语之间又形成一种复杂的网络联系,计算机能够通过这些术语得到数据的含义,并且可以在这种联系上应用逻辑来进行推理,从而完成一些原来不能直接完成的工作。本文对语义Web构想的体系结构进行了讨论,介绍了语义Web的应用和研究现状。语义Web研究的主要目的就是扩展当前的Web,使得网络中所有信息都是具有语义的,是计算机能够理解和处理的,便于人和计算机之间的交互与合作。因而其研究的侧重点就是如何把信息表示为计算机能够理解和处理的形式,即带有语义。本体在创建这种机器可处理的Web内容中扮演着关键的角色,被认为是语义Web的关键智能技术。本文讨论了本体的概念、Web本体描述语言、介绍了本体的分类及目前广泛使用本体,并总结了本体在信息检索与集成及其网页自动分类中的应用。本体的发展和应用导致大量不同的本体的出现,它们可能覆盖相同的领域或者在覆盖的领域有重叠部分。为了不同团体能够彼此理解,需要使用共同的形式化表达,但是不可能让所有的人都对一个共同本体达成共识。所以,当同一领域中出现不同本体时映射(Mapping)的问题就出现了。本文介绍了本体映射的基本概念,总结了目前常用的映射方法并给出了对这些方法的分类,最后介绍了几个典型的本体映射工程。
论文目录
1. 基于语义相似度的本体映射方法研究摘要Abstract第1章 绪论1.1 研究背景1.2 本体映射国内外研究现状1.3 本文的研究内容1.4 本文组织结构第2章 本体构建的相关知识2.1 本体的概念2.2 本体的建模元语2.3 本体建立的原则2.3.1 一致性原则2.3.2 完备性原则2.3.3 减少冗余原则2.4 本体建立示例——高校就业管理本体2.4.1 确定本体领域和应用范围2.4.2 复用现有的本体2.4.3 枚举本体的重要术语2.4.4 定义类和类层次2.4.5 定义类的属性2.4.6 生成实例2.5 领域本体创建过程中存在的问题第3章 本体映射概述3.1 本体异构及解决方案3.2 本体映射概述3.2.1 本体映射问题描述及定义3.2.2 本体映射模型框架3.2.3 相似度的定义3.3 目前本体映射存在问题第4章 相似度计算方法4.1 基于名称的相似度计算4.1.1 基于语法的名称相似度计算4.1.2 知网及其基于知网的语义相似度计算4.2 基于层次结构的相似度计算4.3 基于属性的概念相似度计算4.4 多策略组合方法4.5 阈值的选取第5章 实验系统的实现与分析5.1 实验系统功能介绍5.2 实验系统平台的选择5.2.1 Protege5.2.2 Jena5.3 基本算法设计5.3.1 本体特征提取方法5.3.2 基于语法的名称相似度计算过程5.3.3 基于层次结构的相似度计算过程5.3.4 基于属性的概念相似度计算过程5.4 算法实验结果分析5.4.1 实验本体5.4.2 实验结果及分析第6章 总结与展望6.1 本文主要工作6.2 下一步工作展望参考文献2. 本体的语义表示及映射问题研究摘要Abstract第1章 绪论1.1 引言1.2 语义Web的概念和起源1.3 语义Web的体系结构1.4 语义Web的应用与研究现状1.4.1 智能信息检索1.4.2 基于Agent的分布式计算1.4.3 Web Service1.4.4 企业数据管理1.5 本章小结第2章 基于本体的语义表示机制2.1 本体的起源与定义2.2 本体的功能2.3 Web本体描述语言OWL2.4 现有本体及其分类2.4.1 现有本体2.4.2 Guarino分类2.4.3 Uschold分类2.5 本体构建方法学2.5.1 Enterprise Ontology方法2.5.2 TOVE方法2.5.3 Berneras方法2.5.4 METHONTOLOGY方法2.5.5 SENSUS的方法2.6 本体的应用领域2.6.1 本体在信息检索与集成领域的应用2.6.2 本体在网页自动分类中的应用2.7 本章小结第3章 基于本体的信息集成概述3.1 信息集成的目标3.2 两种信息集成机制3.3 本体在信息集成中的角色3.4 基于本体的信息集成机制3.4.1 单一本体方法(single ontology approach)3.4.2 多本体方法(multiple ontologies approach)3.4.3 混合方法(Hybrid Approaches)3.5 本章小结第4章 本体映射相关问题4.1 本体映射概念4.2 常用的本体映射方法4.2.1 基于语法的映射方法4.2.2 基于概念实例的映射方法4.2.3 基于概念定义的映射方法4.2.4 基于概念结构的映射方法4.2.5 基于规则的映射方法4.2.6 基于统计学的映射方法4.2.7 基于机器学习的映射方法4.2.8 本体代数方法4.2.9 本体聚类方法4.3 本体映射方法的分类4.4 本体映射工程介绍4.4.1 Cupid4.4.2 COMA4.4.3 SF方法4.4.4 OntoMorph系统4.4.5 S-Match动态多维概念映射算法4.5 本章小结参考文献3. The Research of Ontology Mapping Method Based on Semantic SimilarityAbstractChapter 1 Introduction1.1 Research Background1.2 Research Status of Ontology Mapping in Domestic and Abroad1.3 Research Content of This ThesisChapter 2 Relative Knowledge of Construct Ontology2.1 Ontology Concept2.2 Modeling Meta of Ontology2.3 Rules of Establishment Ontology2.3.1 Consistency2.3.2 Completeness2.3.3 Reducing Redundancy Principle2.4 The Example of Ontology Building-University Employment Management2.4.1 Determining Ontology Domain and Scope of Application2.4.2 Reusing Exist Ontology2.4.3 Enumeration Important Terms of Ontology2.4.4 Defining Class and Class Level2.4.5 Defining Attributes of Class2.4.6 Creating Instance2.5 Existing Problems in Domain Ontology Creation ProcessChapter 3 Summary of Ontology Mapping3.1 Solutions of Ontology Heterogeneous3.2 Summary of Ontology Mapping3.2.1 The Description and Definition of Ontology Mapping3.2.2 Model Framework of Ontology Mapping3.2.3 The Definition of Similarity3.3 The Current Problems of Ontology MappingChapter 4 Calculation Method of Similarity4.1 Semantic Similarity Calculation Based on Name4.1.1 Similarity Calculation Based on the Name4.1.2 HowNet and Similarity Calculation Based on HowNet4.2 Similarity Calculation Based on Structer4.3 Similarity Calculation Based on the Property4.4 Multi-strategy Combination Methods4.5 Threshold SelectionChapter 5 The Design and Implementation of Experiment System5.1 The Function of Experimental System5.2 The Choice of Experiment System Platform5.2.1 Protege5.2.2 Jena5.3 Basic Algorithms Design5.3.1 The Method of Ontology Feature's Extraction5.3.2 The Calculation Process of Name Similarity Based on the Grammar5.3.3 The Similarity Calculation Process Based on Level Structer5.3.4 The Calculation Process of Concept Similarity based on Properties5.4 The Analysis of Experiment Results5.4.1 Experimental Ontology5.4.2 The Results and Analysis of ExperimentChapter 6 Summary and Prospects6.1 The Main Work In This Thesis6.2 Outlook of Next WorkReferences4. The Summary of Research on Ontology Semantic and Ontology MappingAbstractChapter 1 Summary of Semantic Web1.1 Introduction1.2 Semantic Web and the Concept of Origin1.3 Semantic Web Architecture1.4 Semantic Web Application and Research Status1.4.1 Intelligent Information Retrieval1.4.2 Agent-Based Distributed Computing1.4.3 Web Service1.4.4 Enterprise Data Management1.5 Chapter SummarizationChapter 2 Ontology Semantic Representation Mechanism2.1 The Ontology's Origin and Definition2.2 Function of Ontology2.3 Web Ontology Language OWL2.4 The Existing Ontology and Classification2.4.1 Existing Ontology2.4.2 Guarino Category2.4.3 Uschold Categories2.5 Ontology Construction Methodology2.5.1 Enterprise Ontology method2.5.2 TOVE Method2.5.3 Berneras Method2.5.4 METHONTOLOGY Method2.5.5 SENSUS Method2.6 Ontology Applications2.6.1 Ontology Applications in Information Retrieval and lintegration2.6.2 Ontology Applicalions in Page Classification2.7 Chapter SummarizationChapter 3 Ontology-based Information Integration3.1 Information Integration Goal3.2 Two Information Integration Mechanism3.3 Ontology in the Role of Information Integration3.4 Ontology-Based Information Integration Mechanism3.4.1 Single Ontology Method3.4.2 Multi-Ontology Method3.4.3 Hybrid Method3.5 Chapter SummarizationChapter 4 Problems Concerning Ontology Mapping4.1 Concept that Ontology Mapping4.2 Ontology Mapping Method Commonly Used4.2.1 Mapping Method Based on Syntax4.2.2 Mapping Method Based on the Concept of Examples4.2.3 Mapping Method Based on the Definition of the Concept4.2.4 Mapping Method Based on the Conceptual Structure4.2.5 Mapping Method Based on Rules4.2.6 Mapping Method Based on Statistics4.2.7 Mapping Method Based on Machine Learning4.2.8 Method Based on Ontology algebra4.2.9 Method Based on Ontology Clustering4.3 Classification As Ontology Mapping Method4.4 Introduction on Ontology Mapping Project4.4.1 Cupid4.4.2 COMA4.4.3 SF Method4.4.4 OntoMorph System4.4.5 S-Match dynamic multi-dimensional concept mapping algorithm4.5 Chapter SummarizationReferences攻读学位期间发表的学术论文和研究成果致谢
相关论文文献
标签:本体论文; 本体映射论文; 语义相似度论文; 知网论文; 语义论文;