个性化搜索引擎的研究与实现

个性化搜索引擎的研究与实现

论文摘要

随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。但现有的搜索引擎基本上采用“一个搜索适用所有用户”的模型,体现不出用户真正的兴趣所在。针对当前搜索引擎的不足,本文研究并实现了一个基于用户反馈的个性化搜索引擎系统。首先,本文介绍了传统搜索引擎、元搜索引擎及个性化搜索引擎的相关背景知识,并提出未来搜索引擎的发展趋势为个性化、智能化、专业化。其次,本文在详细介绍了与本课题开发相关的技术知识后,提出本系统开发的总体设计架构与系统流程,并将该系统分为用户界面模块、搜索模块、学习用户反馈模块、搜索结果优化处理模块来实现。其中,学习用户反馈模块是本文的研究重点。本文设计了一套独特的学习用户反馈的方法:在搜索引擎中引入用户评分制度,获取用户对搜索结果的满意度评价,挖掘隐藏信息,生成用户兴趣模式,及时优化搜索结果,优先返回用户感兴趣的网页内容,使搜索结果面向“特定用户”。此外,本系统还向用户推荐其他用户的兴趣模式,使得搜索引擎的用户可以分享其他用户的搜索成果,提高搜索效率。最后,在实现了基于用户反馈的个性化搜索引擎之后,本文提出在此搜索引擎中引入自动聚类技术的改进方案,给出了引入聚类的优化思想并通过实验验证了该思想的可行性,为本文今后的研究确定了方向。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 本课题研究意义
  • 1.3 本课题主要研究内容
  • 1.4 论文结构和章节安排
  • 第2章 搜索引擎概述
  • 2.1 搜索引擎
  • 2.1.1 搜索引擎工作原理
  • 2.1.2 搜索引擎分类
  • 2.2 元搜索引擎
  • 2.2.1 元搜索引擎工作原理
  • 2.2.2 元搜索引擎分类
  • 2.2.3 元搜索引擎的优势及局限性
  • 2.3 个性化搜索引擎
  • 2.4 未来搜索引擎的发展趋势
  • 2.5 小结
  • 第3章 个性化搜索引擎开发的相关技术
  • 3.1 信息抽取技术
  • 3.2 Lucene检索工具包
  • 3.2.1 什么是Lucene
  • 3.2.2 Lucene的系统结构与源代码结构
  • 3.3 中文分词技术
  • 3.4 文本表示模型
  • 3.4.1 文本表示方法
  • 3.4.2 向量空间模型
  • 3.5 自动聚类技术
  • 3.5.1 聚类
  • 3.5.2 聚类方法
  • 3.5.3 模糊C均值聚类算法
  • 3.6 用户行为分析
  • 3.7 小结
  • 第4章 基于用户反馈的个性化搜索引擎的总体设计
  • 4.1 系统需求分析及总体设计
  • 4.1.1 系统设计目标
  • 4.1.2 系统开发环境与运行平台
  • 4.1.3 系统开发需解决的关键问题
  • 4.2 系统功能及架构设计
  • 4.2.1 系统功能设计
  • 4.2.2 系统架构设计
  • 4.3 系统流程设计
  • 4.4 系统数据库设计
  • 4.5 小结
  • 第5章 基于用户反馈的个性化搜索引擎的具体实现
  • 5.1 模块设计
  • 5.2 用户界面模块
  • 5.3 搜索模块
  • 5.3.1 WEB信息抽取
  • 5.3.2 分词技术
  • 5.4 学习用户反馈模块
  • 5.4.1 用户反馈信息
  • 5.4.2 用户兴趣模式
  • 5.4.3 学习用户反馈
  • 5.5 搜索结果优化模块
  • 5.6 系统运行结果及示例
  • 5.7 小结
  • 第6章 基于用户反馈的个性化搜索引擎的改进方案
  • 6.1 引入聚类
  • 6.2 基于聚类的改进方案
  • 6.3 用户聚类的设计
  • 6.4 搜索结果聚类的设计
  • 6.4.1 搜索结果的表示
  • 6.4.2 聚类算法的选择
  • 6.4.3 带聚类的搜索结果优化算法
  • 6.5 仿真实验
  • 6.6 小结
  • 第7章 总结与展望
  • 7.1 总结与创新点
  • 7.2 展望
  • 致谢
  • 参考文献
  • 攻读学位期间的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    个性化搜索引擎的研究与实现
    下载Doc文档

    猜你喜欢