论文摘要
随着海洋科学的发展,我国保存了大量的海洋科学数据,这些数据涉及海洋科学的各个方面,如海洋物理、海洋生物、海洋化学、海洋气象等许多研究领域,这些数据被越来越多的不同研究目的的科学团体或个人收集。由于海洋数据的采集的设备不同、信息处理的平台不同、数据标准不一致、数据存储的格式也不同、研究目的的不同,这些海洋数据成为异构数据,兼容性、可比性差、利用率低,这造成了海洋信息资源的极大浪费。为了充分利用这些数据,同时避免数据资源的重复建设,我们迫切需要对这些异构海洋数据进行集成共享。本体的研究对象是某一领域中所使用的词汇,它定义了组成这些词汇的基本术语和关系,同样,它也定义了一系列如何将术语与关系组合成词汇的规则。传统的数据集成技术很难解决数据的语义异构,本体对于解决语义异构有着很大的优势,因此本文利用本体技术来尝试解决海洋数据的语义异构问题。本文首先讨论了当前在数据集成中应用的各类技术,引出本体在解决语义异构方面的优势,进而详细介绍了本体的概念、本体描述语言、本体分类,重点研究本体在数据集成方面的关键技术,并以2个海洋遥感数据源为基础提出了基于本体的海洋数据集成系统架构,并详细说明了各个层的功能、设计和操作流程,并在此基础上开发了一个测试系统。通过实验和测试,该系统较好地解决了海洋遥感异构数据的语义异构问题,同时还有较好的可扩展性,可以实现数据源的动态集成,即增加新数据源时,只需加入对应的局部本体并在全局本体中加入相关的概念的映射即可。另外,由于所有的数据访问都是通过本体对局部数据源的访问进行的,所以很好的保证了数据的一致性和实时性。因此,应用本体技术解决海洋数据的异构性,特别是海洋数据的语义异构对于海洋数据的充分集成和共享,对于提高海洋信息资源的利用率,对于保持数据资源的一致性、实时性,对于避免大量的数据资源的重复建设都有十分重要的意义。并且对于用户来说也有着很大的便利性,即用户只需考虑要查询提取的数据,而不需要考虑哪一个数据源,什么样的数据源;只需要指定想要得到的数据要求,而不必关注数据的提取、合成等。