基于用户的个性化搜索引擎研究

基于用户的个性化搜索引擎研究

论文摘要

随着Internet的飞速发展和普及,越来越多的信息不断加入到网络中,在信息量极大丰富的同时,用户面临着“信息过载”和“资源迷向”的问题。“基于用户”的个性化搜索引擎成为解决上述问题的主要方法,个性化搜索引擎及其个性化服务技术成为了现行的研究热点,并且取得了阶段性的研究成果。本文主要介绍了个性化搜索引擎的研究现状以及现有个性化搜索引擎的不足,通过记录、分析用户在使用搜索引擎时的行为特征,提出了一种新的基于用户信息收集和反馈技术的个性化搜索引擎研究框架——基于用户的个性化搜索引擎系统,研究工作具有一定的理论意义和较强的实用价值。本论文所作的主要工作如下:(1)介绍了个性化搜索引擎的工作原理,提出了建立在个性化搜索引擎体系结构上用户信息的收集方法、收集的内容和存储方式,基于上述内容,描述了基于用户描述文件的用户建模方法。(2)通过隐式收集用户信息,提出了一种基于该技术的用户模型的更新方法,并在此基础上,结合用户模型的基本特点,描述了一种新的个性化排序方法——基于用户缓存的个性化排序方法,最后根据个性化搜索引擎系统的特点,提出了两项评价个性化搜索引擎的性能指标——用户行为指数和用户行为准确率。(3)本文最后实现了一个基于用户的个性化搜索引擎系统PSE,证明了上述架构的可行性,此外,通过收集用户的查询信息,证明了用户模型的建立,在某种程度上,提高了成员搜索引擎的查准率,通过平均用户行为指数和平均用户行为准确率这两项评价指标,证明了基于用户缓存的个性化排序方法具有一定的优越性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状及存在问题
  • 1.3 本课题研究意义
  • 1.4 本课题研究内容
  • 1.5 本文组织结构
  • 第二章 个性化搜索引擎及其体系结构
  • 2.1 用户行为分析
  • 2.1.1 用户行为
  • 2.1.2 基于用户行为的启示
  • 2.2 个性化搜索引擎系统
  • 2.2.1 假设前提
  • 2.2.2 系统构成
  • 2.3 体系结构
  • 2.3.1 系统架构
  • 2.3.2 用户接口层
  • 2.3.3 用户建模层
  • 2.3.4 系统检索层
  • 2.4 本章小结
  • 第三章 用户模型建立与更新
  • 3.1 用户信息收集
  • 3.1.1 用户消息格式
  • 3.1.2 用户存储表
  • 3.2 用户日志处理
  • 3.2.1 日志处理步骤
  • 3.2.2 特征向量提取
  • 3.3 用户模型建立
  • 3.3.1 选择数据
  • 3.3.2 关联会话
  • 3.3.3 特征向量矩阵
  • 3.3.4 用户模型建立
  • 3.4 用户模型更新
  • 3.4.1 基于反馈技术的用户模型更新
  • 3.4.2 简化用户模型更新方法
  • 3.5 本章小结
  • 第四章 扩展查询与个性化排序
  • 4.1 查询消息处理
  • 4.2 扩展查询
  • 4.2.1 扩展查询概述
  • 4.2.2 基于用户兴趣度的扩展查询
  • 4.3 个性化排序
  • 4.3.1 用户缓存
  • 4.3.2 基于用户缓存的个性化排序
  • 4.4 评价指标
  • 4.4.1 评价指标概述
  • 4.4.2 用户行为指数
  • 4.4.3 用户行为准确率
  • 4.5 本章小结
  • 第五章 个性化搜索引擎系统PSE的设计与实现
  • 5.1 系统设计
  • 5.1.1 系统架构设计
  • 5.1.2 系统模块功能
  • 5.1.3 系统数据库设计
  • 5.2 系统实现
  • 5.2.1 用户接口界面
  • 5.2.2 扩展查询
  • 5.2.3 个性化排序
  • 5.3 系统测试
  • 5.3.1 测试设计
  • 5.3.2 测试结果分析
  • 5.4 本章小结
  • 第六章 结论与展望
  • 6.1 结论
  • 6.2 展望
  • 参考文献
  • 攻读硕士期间参与的学术活动
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于用户的个性化搜索引擎研究
    下载Doc文档

    猜你喜欢