论文摘要
语义Web被称为下一代Web技术,RDF是面向语义Web的标准框架,目前RDF已成为语义Web体系结构的核心内容。SPARQL是W3C工作组为RDF数据设计的一种查询语言和协议。SPRAQL中RDF图管理命令可创建(Crea t)图、删除(Dele te)图,并允许图与图之间的移动(Move)、复制(Copy)和合并(Add)操作。SPARQL提供的RDF图管理Add命令,功能是对两个RDF图中不相同的RDF三元组进行合并处理。执行此命令时,只要在主语、谓词或宾语中检测到字面上的不相同,即认为它们是完全不同的三元组。但是实际情况中,对于同一资源的不同描述,虽然在字面上不相同,但有可能在语义上是相同或相似的,所以进行Add操作后的RDF图中可能会出现语义相同的重复描述,无疑增加了RDF图的冗余数据。本文提出了基于WordNet的RDF三元组相似性评估方案,并在此评估方案的基础上提出一种新的RDF图管理命令SimiAdd。SimiAdd命令不再检查RDF三元组在字面上是否完全相同,而是检查其描述内容是否具有语义上的相似性,将RDF图中不具有语义相似性的RDF三元组进行合并处理。本文设计并实现了一种RDF数据图模式管理工具,不仅包含Create、Move、Copy和Add命令,还包含了本文新提出的SimiAdd命令。在RDF图模式管理工具实现中,详细介绍了工具总体框架及框架内部运行流程,并定义RDF图中三元组存储数据结构。另外,管理工具还对外提供数据模型转换接口,能有效的将RDF图数据在RDF/XML模型和三元组模型间转换,便于满足各数据模型使用的需要。通过对比Add命令和SimiAdd命令执行的结果,基于WordNet的RDF三元组相似度评估方案而提出的SimiAdd命令,可以在两个RDF图做合并处理时,有效的过滤掉某些具有语义相似信息的三元组,在一定程度上避免了并集RDF图数据过多的冗余,使RDF图管理更加便捷。