关键词驱动的结构化查询构建方法研究

关键词驱动的结构化查询构建方法研究

论文摘要

随着语义网的不断发展,万维网上拥有了越来越多的以结构化和机器可理解的形式发布的数据,这为用户使用这些结构化数据进行语义查询提供了机会。但由于用户构造结构化查询的代价太高以及用户更偏好进行关键词查询,因此在结构化数据上进行关键词查询成了当前研究的热门方向。但关键词查询带有先天的歧义性,如何有效的在结构化数据上进行关键词查询仍然面临着很大的挑战。本文在已有的研究成果基础上,围绕如何在RDF结构化数据上进行关键词交互与搜索展开研究工作。本文采用的技术流派是将关键词查询转换为结构化查询后,由用户选择合适的查询并由底层数据库执行查询返回答案,主要贡献在于两方面:新型的候选查询排序算法以及合理有效利用了用户交互。本文提出了两种由关键词查询转化为结构化查询时的交互方式和排序方法。方法一是一种受限的结构化查询----星型查询,自动预测用户输入的关键词的若干类别,基于本文提出的查询排序算法对带有类别的关键词进行组合后排序,最后通过用户交互得到其对应的信息需求。方法二是一种通用的结构化查询方法,在关键词映射环节通过自动补全方式与用户交互,从而很大程度缓解了由关键词查询的固有歧义性所引起的对结构化数据进行关键词查询时效果并不理想的问题;基于考虑用户关键词顺序的打分函数,从而使得该算法计算得到的前k条查询精确度大幅提高。最后基于上述两种方法实现了两套原型系统,并对其进行丰富的实验评估,实验结果验证了两种方法在正确性和效率上都有可观的效果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 相关工作
  • 1.3 主要研究内容
  • 1.4 论文结构
  • 第2章 预备知识
  • 2.1 语义网相关概念
  • 2.1.1 RDF
  • 2.1.2 本体
  • 2.1.3 SPARQL
  • 2.1.4 Linked Data
  • 2.2 研究问题定义
  • 第3章 星型查询的探索
  • 3.1 问题陈述
  • 3.2 方法概览
  • 3.3 关键词到查询
  • 3.3.1 预处理
  • 3.3.2 关键词映射
  • 3.3.3 打分函数
  • 3.3.4 查询构造
  • 3.4 应用系统
  • 3.5 本章小结
  • 第4章 前k条查询的图探索方法
  • 4.1 问题陈述
  • 4.2 方法概览
  • 4.3 关键词到查询
  • 4.3.1 预处理
  • 4.3.2 关键词映射
  • 4.3.3 打分函数
  • 4.3.4 图探索
  • 4.3.5 前k个子图结构计算
  • 4.3.6 查询映射
  • 4.4 应用系统
  • 4.5 本章小结
  • 第5章 实验评估
  • 5.1 有效性评测
  • 5.2 性能评测
  • 第6章 结束语
  • 6.1 本文工作
  • 6.2 未来展望
  • 致谢
  • 参考文献
  • 附录 研究生期间工作
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    关键词驱动的结构化查询构建方法研究
    下载Doc文档

    猜你喜欢