论文摘要
随着语义网的不断发展,万维网上拥有了越来越多的以结构化和机器可理解的形式发布的数据,这为用户使用这些结构化数据进行语义查询提供了机会。但由于用户构造结构化查询的代价太高以及用户更偏好进行关键词查询,因此在结构化数据上进行关键词查询成了当前研究的热门方向。但关键词查询带有先天的歧义性,如何有效的在结构化数据上进行关键词查询仍然面临着很大的挑战。本文在已有的研究成果基础上,围绕如何在RDF结构化数据上进行关键词交互与搜索展开研究工作。本文采用的技术流派是将关键词查询转换为结构化查询后,由用户选择合适的查询并由底层数据库执行查询返回答案,主要贡献在于两方面:新型的候选查询排序算法以及合理有效利用了用户交互。本文提出了两种由关键词查询转化为结构化查询时的交互方式和排序方法。方法一是一种受限的结构化查询----星型查询,自动预测用户输入的关键词的若干类别,基于本文提出的查询排序算法对带有类别的关键词进行组合后排序,最后通过用户交互得到其对应的信息需求。方法二是一种通用的结构化查询方法,在关键词映射环节通过自动补全方式与用户交互,从而很大程度缓解了由关键词查询的固有歧义性所引起的对结构化数据进行关键词查询时效果并不理想的问题;基于考虑用户关键词顺序的打分函数,从而使得该算法计算得到的前k条查询精确度大幅提高。最后基于上述两种方法实现了两套原型系统,并对其进行丰富的实验评估,实验结果验证了两种方法在正确性和效率上都有可观的效果。