基于用户日志的信息检索研究

基于用户日志的信息检索研究

论文摘要

Internet上巨大的信息量在给人类带来丰富信息资源的同时,也给信息检索带来了难题。如何在信息的海洋里找到自己想要的那根针,而且要找得准且快。由于用户与信息作者的理解不尽相同,导致各自使用的关键词也不一致,在现有搜索引擎技术—关键词匹配的限制下,使得信息检索很大程度上依赖于用户提交的查询关键词。本文提出了一种基于用户日志的查询扩展方法,该方法可以在用户提交的查询关键词基础上扩展出与该查询意义相近的其他常用查询,这样使得用户更加容易找到需要的信息。 本文的方法是首先通过对Query-Result有向图的关系分析得到一个初始的候选查询集,这是纯粹通过链接关系来查找相关查询。在此基础上,我们试图从查询本身所代表的文本意义上来过滤相关度极小的候选查询,本文称为文档片断分析。文档片断(Snippet)就是搜索引擎结果列表上简要介绍每个URL内容的文字说明。一个查询得到一个结果URL集合,然后把每个URL的文档片断合并成一个综合文档片断。由这个综合文档片断提取出的关键词假定为该查询的主题词,并用这些关键词去匹配每个候选查询的综合片断文档,最后得出每个候选查询的相关度。 我们利用Google API采集了实验数据,并设计了原型系统对本文的方法进行了实验评估。实验表明,我们的方法相当有效,能够发现相关度较高的相关查询。 最后,关于进一步工作的方向进行了简要的讨论。

论文目录

  • 第1章 引言
  • 1.1 概述
  • 1.2 Web信息检索现状
  • 1.2.1 元搜索引擎
  • 1.2.2 搜索引擎现状
  • 1.3 本文工作
  • 1.4 本文的组织
  • 第2章 Web挖掘
  • 2.1 Web内容挖掘
  • 2.2 Web结构挖掘
  • 2.3 Web用法挖掘
  • 2.4 Web挖掘与其他研究的关系
  • 2.5 小结
  • 第3章 特定主题的搜索研究
  • 3.1 模型质量评价
  • 3.2 Web图模型
  • 3.3 网页评价算法及分析
  • 3.3.1 PageRank
  • 3.3.2 HITS
  • 3.3.3 分析
  • 3.4 特定主题 SG-HITS算法
  • 3.4.1 文档相关度
  • 3.4.2 SG-HITS算法
  • 3.5 小结
  • 第4章 基于用户日志的查询扩展
  • 4.1 查询扩展
  • 4.1.1 查询扩展的全局和局部方法
  • 4.1.2 局部上下文分析
  • 4.2 基于用户日志的查询扩展
  • 4.2.1 基本思想
  • 4.2.2 Query-Result有向图分析
  • 4.2.3 文档片断分析
  • 4.2.4 关键词自动提取技术
  • 4.2.5 基于后缀序列的关键词自动提取技术
  • 4.3 小结
  • 第5章 原型系统及实验评估
  • 5.1 数据采集& Google API
  • 5.2 原型系统&实验评估
  • 5.3 小结
  • 第6章 结论与展望
  • 6.1 结论
  • 6.2 进一步工作的方向
  • 致谢
  • 参考文献
  • 参加国内学术会议情况
  • 个人简历 在读期间发表的学术论文与研究成果
  • 相关论文文献

    • [1].基于Storm的实时用户日志管理系统[J]. 湖北工业大学学报 2016(05)
    • [2].结合用户日志的局部上下文分析方法[J]. 计算机工程与应用 2012(12)
    • [3].基于用户日志的相关搜索模型研究[J]. 信息技术 2015(02)
    • [4].基于Web用户日志的电子商务领域竞争对手分析——以11家电子商务网站为例[J]. 信息资源管理学报 2013(04)
    • [5].基于朴素贝叶斯点击预测的查询推荐方法[J]. 计算机应用与软件 2016(10)
    • [6].基于用户日志的移动搜索行为分析[J]. 图书情报工作 2013(19)
    • [7].校园记忆之图书馆生活——基于用户日志挖掘的呈现[J]. 数字图书馆论坛 2014(10)
    • [8].基于用户日志挖掘的查询扩展方法[J]. 计算机应用与软件 2012(06)
    • [9].基于用户日志的本体进化[J]. 计算机工程与应用 2008(06)
    • [10].一种基于本体和用户日志的查询扩展方法[J]. 计算机工程与应用 2015(01)
    • [11].基于粒子群算法在Web使用挖掘聚类模型的研究[J]. 信息与电脑(理论版) 2014(18)
    • [12].基于SSL协议与SSH的远登录模型研究[J]. 网络安全技术与应用 2009(05)
    • [13].区域性医学数字图书馆利用与用户评价[J]. 医学信息学杂志 2016(10)
    • [14].常用中文电子资源访问日志功能分析及研究[J]. 情报理论与实践 2011(02)

    标签:;  ;  ;  ;  ;  

    基于用户日志的信息检索研究
    下载Doc文档

    猜你喜欢