客户端个性化信息搜索服务研究

客户端个性化信息搜索服务研究

论文摘要

随着Web信息的爆炸式增长,如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰人们的一大难题。传统搜索引擎技术满足了人们一定的查询需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同兴趣爱好的用户个性化需求。个性化信息搜索服务就是针对这个问题提出来的。个性化信息搜索服务是指针对不同用户的不同特点提供不同的服务策略和服务内容,其实现方式可以在客户端,也可以在服务器端。本文主要研究的是客户端个性化信息搜索服务。本文讨论了一般搜索引擎系统的结构和工作过程,阐述了实现搜索引擎的各个关键技术,提出了下一代搜索引擎即个性化搜索引擎的定制服务的发展过程,讨论了个性化信息搜索服务定义、分类及其特点,以及客户端个性化搜索引擎体系架构和个性化相关算法等。用户兴趣的获取技术可分为被动获取和主动获取两种方式。本文提出的基于模板的用户个性化搜索把两种方式结合起来,其中建立初始用户兴趣描述的实现属于被动获取方法,主要是利用用户对模板的信息输入来获取用户的兴趣信息,从而初步获得用户的兴趣模型;收集用户反馈信息的实现属于主动获取,它不需要用户亲自输入自己感兴趣的内容,而是从用户平时的网络浏览习惯去主动发现用户的兴趣,进一步优化用户兴趣模板。本文实现的基于用户隐式信息的个性化搜索也是属于主动获取方式。根据目前个性化信息搜索服务的分类特点,针对存在局域网的网络,本文提出了一种三级用户兴趣结构模型。即在客户端和局域网服务器端同时实现个性化处理,这样可以让用户体验更完美的个性化信息服务。另外,针对目前描述用户兴趣用一元组的向量描述方法,本文提出了新的用户兴趣描述方法。第一种是用森林结构来描述用户兴趣,这样,用户兴趣的各方面会得到更合理的表述。还有一种是根据前面提出的三级兴趣结构模型引申出的多级结构来描述用户兴趣。最后,本文在Windows平台上使用Java语言以及Lucene工具包,开发了一个基于Lucene的全文搜索引擎实验原型系统,在此基础上实现了本文提出的几种个性化信息服务的研究思路。针对目前还没有一种搜索引擎反馈给人们按日期排序的新闻搜索结果的状况,本文设计的新闻排序搜索系统具有现实的意义。最后进行了全文总结并提出了进一步研究工作的设想。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 背景与选题依据
  • 1.1.1 研究背景
  • 1.1.2 搜索引擎的分类
  • 1.1.3 国内外发展现状
  • 1.1.4 目前搜索引擎存在的问题
  • 1.1.5 搜索引擎的发展趋势
  • 1.2 论文研究的意义
  • 1.3 论文研究的内容
  • 第2章 搜索引擎相关技术
  • 2.1 搜索引擎概述
  • 2.1.1 搜索引擎的结构
  • 2.1.2 搜索引擎的工作过程
  • 2.1.3 搜索引擎的性能指标
  • 2.2 搜索引擎的关键技术浅析
  • 2.2.1 搜索引擎的搜索技术
  • 2.2.2 搜索引擎的索引技术
  • 2.2.3 搜索引擎的检索技术
  • 2.2.4 搜索引擎的接口技术
  • 2.3 文本预处理
  • 2.4 中文分词
  • 2.4.1 分词
  • 2.4.2 中文分词的方式
  • 2.5 倒排索引
  • 2.5.1 倒排索引的原理
  • 2.5.2 倒排索引的特点
  • 2.6 检索结果的排序
  • 2.6.1 PageRank 算法
  • 2.6.2 改进的PageRank 算法
  • 2.7 本章小结
  • 第3章 用户个性化信息搜索服务
  • 3.1 个性化信息搜索服务的定义
  • 3.2 个性化信息搜索服务分类及特点
  • 3.3 客户端个性化搜索引擎
  • 3.4 实现个性化服务的方式
  • 3.5 用户兴趣的获取
  • 3.6 三级用户兴趣结构模型
  • 3.7 用户兴趣描述
  • 3.8 个性化相关算法
  • 3.8.1 基于规则的个性化搜索算法
  • 3.8.2 协作过滤个性化推荐算法
  • 3.8.3 基于内容过滤的个性化搜索算法
  • 3.9 本章小结
  • 第4章 用户个性化信息搜索服务的实现
  • 4.1 个性化搜索系统的总体设计
  • 4.2 实验平台
  • 4.2.1 Lucene 简介
  • 4.2.2 Lucene 的包结构
  • 4.2.3 Lucene 的文档格式
  • 4.3 搜索系统实验平台的实现
  • 4.3.1 HTML 网页文本分析模块
  • 4.3.2 文档预处理
  • 4.3.3 建立索引
  • 4.3.4 实现检索
  • 4.3.5 中文分词的实现
  • 4.3.6 对搜索结果的排序
  • 4.4 基于模板的用户个性化搜索
  • 4.4.1 支撑技术
  • 4.4.2 设计思想
  • 4.4.3 建立初始用户兴趣描述
  • 4.4.4 收集用户反馈信息
  • 4.5 基于用户隐式信息的个性化搜索
  • 4.5.1 设计思想
  • 4.5.2 实现流程
  • 4.6 新闻排序搜索系统
  • 4.6.1 新闻排序搜索系统设计思想
  • 4.6.2 新闻排序搜索系统实现流程
  • 4.7 本章小结
  • 第5章 结束语
  • 5.1 全文工作总结
  • 5.2 下一步工作计划
  • 参考文献
  • 致谢
  • 附录A 攻读学位期间所发表的学术论文
  • 相关论文文献

    • [1].校园梦网打造搜索服务新平台[J]. 中小学电教 2008(03)
    • [2].搜索服务公司客户行为分析[J]. 现代商业 2014(05)
    • [3].豌豆荚携手Bing为用户提供应用搜索服务[J]. 计算机与网络 2013(21)
    • [4].搜索服务商操纵结果行为的反垄断法分析[J]. 中国应用法学 2017(02)
    • [5].规范搜索服务的契机不光属于百度[J]. 当代贵州 2016(27)
    • [6].浅谈网络搜索中的商标合理使用[J]. 法制与社会 2017(22)
    • [7].用户个性化模式的信息搜索服务探索[J]. 农业图书情报学刊 2013(07)
    • [8].应用阿里云搜索服务构建图书馆站内搜索引擎[J]. 现代图书情报技术 2013(06)
    • [9].大数据环境下科技信息精准搜索服务探析[J]. 情报科学 2020(07)
    • [10].“被遗忘权”的日本司法判例与探析——以搜索服务运营商删除义务为焦点[J]. 贵州大学学报(社会科学版) 2019(05)
    • [11].Google图书搜索服务的版权侵权分析[J]. 网络法律评论 2012(01)
    • [12].国家级主要农作物品种信息搜索服务平台运行中的主要问题及改进建议[J]. 种子世界 2013(06)
    • [13].基于可拓策略生成技术的商品搜索服务改进研究[J]. 数学的实践与认识 2009(04)
    • [14].视线[J]. 现代计算机(普及版) 2010(04)
    • [15].新闻搜索服务的版权争议:国外实践及启示[J]. 河北青年管理干部学院学报 2008(04)
    • [16].群对群(G2G)计算的G2G搜索服务研究[J]. 深圳信息职业技术学院学报 2013(03)
    • [17].社交搜索服务Greplin提供文件内搜索[J]. 硅谷 2011(20)
    • [18].Hipmunk:另类旅游搜索服务提供商[J]. 创业邦 2011(07)
    • [19].基于情景感知的图书馆移动视觉搜索服务设计研究[J]. 图书馆学研究 2017(16)
    • [20].谷歌在印度推出语音搜索服务[J]. 移动通信 2008(18)
    • [21].基于搜索服务的移动商业APP设计研究[J]. 装饰 2014(06)
    • [22].快乐英语,有问必应 微软必应推出必应词典,提供中英文翻译搜索服务[J]. 电脑编程技巧与维护 2010(09)
    • [23].面向物联网的实体实时搜索服务综述[J]. 计算机应用研究 2011(06)
    • [24].知识随搜索流动[J]. IT经理世界 2015(24)
    • [25].图书馆移动视觉搜索服务现状、障碍与对策研究[J]. 图书馆 2018(07)
    • [26].高校数字化信息资源多维度聚合搜索服务与应用研究[J]. 情报科学 2017(04)
    • [27].Greplin 私人信息打包搜索[J]. 投资与合作 2011(06)
    • [28].谷歌推中文手机语音搜索服务[J]. 计算机与网络 2009(19)
    • [29].全国院校炎培耪 共创教育新景象[J]. 中国乡镇企业 2008(03)
    • [30].搜索引擎竞价排名商业模式的规制[J]. 暨南学报(哲学社会科学版) 2014(02)

    标签:;  ;  ;  ;  

    客户端个性化信息搜索服务研究
    下载Doc文档

    猜你喜欢