论文摘要
本体作为一种能在语义和知识层次上描述知识系统的概念模型和建模工具,自被提出以来就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和Web上异构信息的处理、语义Web等。目前Web上大量数据都是以关系数据库技术存储,这些信息被称为深层Web(Deep Web、Invisible Web)。相对于由静态Web页面构成的表层Web(SurfaceWeb、Visible Web)信息,深层Web信息只能通过响应具体的请求动态生成,因此传统搜索引擎无法获取这些深层信息。深层Web资源内容更为丰富,专业性较强,质量比一般网络资源即表层Web高。因此,怎样能够自动检索和处理这些宝贵的深层Web资源成为人们关注的一个问题。本体构建过程中可以消除的语义异构信息,最常见的有命名异构、属性异构、等价元素、包含元素、交叉元素等。在基于本体的数据集成中,构建全局本体以及描述数据源內容的局部本体,并定义全局本体到各个数据源输出模式的语义映射,以消除数据源语义异构,从而完成语义级的查询处理。本文的研究目标是基于关系数据库快捷有效的构建包含丰富语义关联的本体信息,使得科学数据库能够较好的共享和互操作,这是科学数据库系统从“管理数据”提升到“管理知识”的有效途径。本文首先简要介绍了研究背景,分析了传统本体构建技术存在的局限,提出了基于关系数据库半自动构建本体这一途径;接着阐述了本体相关技术;随后在讨论了基于关系数据库构建本体的若干关键技术,主要包含关系数据库与本体之间的语义映射规则定义、局部本体的规范化处理等;在此基础上提出了基于关系数据库构建本体的实现框架,最后介绍了系统实现,并对将来的工作进行了展望。