信息检索中个性化元搜索结果合成的研究

信息检索中个性化元搜索结果合成的研究

论文摘要

如何在Internet海量信息中快速找到用户感兴趣的信息成为困扰人们的主要问题。元搜索引擎虽然提高了查全率,但仍没能很好的解决查准率问题,本文提出了一种改进的基于用户兴趣的元搜索结果合成算法。论文首先研究了信息检索技术及元搜索引擎技术,探讨了元搜索结果合成中涉及到的关键技术;然后研究了用户兴趣模型,提出用户查询向用户兴趣类的映射算法;接着提出本文的研究重点——基于用户兴趣的元搜索结果合成算法,该算法在改进的摘要/位置法计算用户查询与查询结果相关度的基础上引入了词项和用户兴趣,实现了元搜索引擎的个性化;最后实现了个性化的信息检索原型,基于用户兴趣的结果合成算法应用于其中,对算法进行了实验分析,分别与单个搜索引擎以及其他几种传统结果合并算法比较,表明此算法保证了搜索结果的查全率的同时提高了查准率,从而改善了用户检索效果和效率,满足了用户检索的个性化需求。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 元搜索引擎现状分析
  • 1.3 研究意义
  • 1.4 论文内容和结构
  • 1.5 本章小结
  • 第二章 信息检索与元搜索引擎
  • 2.1 信息检索技术与理论基础
  • 2.1.1 信息检索的概念
  • 2.1.2 信息检索的过程及组成
  • 2.1.3 经典信息检索模型
  • 2.1.4 信息检索算法
  • 2.2 元搜索引擎
  • 2.2.1 元搜索引擎的构成
  • 2.2.2 元搜索引擎的分类
  • 2.2.3 元搜索引擎的优势
  • 2.2.4 元搜索引擎的局限性
  • 2.2.5 元搜索引擎的评价目标
  • 2.3 本章小结
  • 第三章 元搜索结果合成的关键技术
  • 3.1 文本选择算法
  • 3.1.1 用户指定算法
  • 3.1.2 权值分配算法
  • 3.1.3 基于学习的算法
  • 3.1.4 保证返回有效文本的算法
  • 3.2 结果合并算法
  • 3.2.1 局部相似度调整算法
  • 3.2.2 全局相似度估算算法
  • 3.3 本章小结
  • 第四章 用户兴趣模型
  • 4.1 模型的总体结构
  • 4.2 兴趣分类参考模型
  • 4.3 用户兴趣树
  • 4.4 用户兴趣向量的表示
  • 4.5 用户查询到用户兴趣类的映射
  • 4.6 本章小节
  • 第五章 个性化元搜索结果合成
  • 5.1 个性化信息检索系统的功能结构
  • 5.2 个性化信息检索系统工作流程
  • 5.3 查询参数转换
  • 5.4 搜索结果页面信息提取
  • 5.4.1 网页信息的提取流程(html)
  • 5.4.2 HTML控制符号处理
  • 5.4.3 文本信息的预处理
  • 5.5 基于用户兴趣的结果合成(PMSRM)
  • 5.5.1 改进的摘要/位置法
  • 5.5.2 查询结果与用户查询的相似度计算
  • 5.5.3 查询结果去重
  • 5.5.4 结果在成员引擎上的得分计算
  • 5.5.5 查询结果的合成
  • 5.5.6 无效链接检查
  • 5.6 实验分析
  • 5.6.1 对重叠文档的两种假设
  • 5.6.2 PMSRM与单独搜索引擎比较
  • 5.6.3 PMSRM与几种常用合并算法比较
  • 5.7 本章小结
  • 第六章 总结与展望
  • 6.1 论文总结
  • 6.2 研究展望
  • 致谢
  • 参考文献
  • 读研期间研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    信息检索中个性化元搜索结果合成的研究
    下载Doc文档

    猜你喜欢