论文摘要
如何在Internet海量信息中快速找到用户感兴趣的信息成为困扰人们的主要问题。元搜索引擎虽然提高了查全率,但仍没能很好的解决查准率问题,本文提出了一种改进的基于用户兴趣的元搜索结果合成算法。论文首先研究了信息检索技术及元搜索引擎技术,探讨了元搜索结果合成中涉及到的关键技术;然后研究了用户兴趣模型,提出用户查询向用户兴趣类的映射算法;接着提出本文的研究重点——基于用户兴趣的元搜索结果合成算法,该算法在改进的摘要/位置法计算用户查询与查询结果相关度的基础上引入了词项和用户兴趣,实现了元搜索引擎的个性化;最后实现了个性化的信息检索原型,基于用户兴趣的结果合成算法应用于其中,对算法进行了实验分析,分别与单个搜索引擎以及其他几种传统结果合并算法比较,表明此算法保证了搜索结果的查全率的同时提高了查准率,从而改善了用户检索效果和效率,满足了用户检索的个性化需求。
论文目录
摘要Abstract第一章 绪论1.1 课题背景1.2 元搜索引擎现状分析1.3 研究意义1.4 论文内容和结构1.5 本章小结第二章 信息检索与元搜索引擎2.1 信息检索技术与理论基础2.1.1 信息检索的概念2.1.2 信息检索的过程及组成2.1.3 经典信息检索模型2.1.4 信息检索算法2.2 元搜索引擎2.2.1 元搜索引擎的构成2.2.2 元搜索引擎的分类2.2.3 元搜索引擎的优势2.2.4 元搜索引擎的局限性2.2.5 元搜索引擎的评价目标2.3 本章小结第三章 元搜索结果合成的关键技术3.1 文本选择算法3.1.1 用户指定算法3.1.2 权值分配算法3.1.3 基于学习的算法3.1.4 保证返回有效文本的算法3.2 结果合并算法3.2.1 局部相似度调整算法3.2.2 全局相似度估算算法3.3 本章小结第四章 用户兴趣模型4.1 模型的总体结构4.2 兴趣分类参考模型4.3 用户兴趣树4.4 用户兴趣向量的表示4.5 用户查询到用户兴趣类的映射4.6 本章小节第五章 个性化元搜索结果合成5.1 个性化信息检索系统的功能结构5.2 个性化信息检索系统工作流程5.3 查询参数转换5.4 搜索结果页面信息提取5.4.1 网页信息的提取流程(html)5.4.2 HTML控制符号处理5.4.3 文本信息的预处理5.5 基于用户兴趣的结果合成(PMSRM)5.5.1 改进的摘要/位置法5.5.2 查询结果与用户查询的相似度计算5.5.3 查询结果去重5.5.4 结果在成员引擎上的得分计算5.5.5 查询结果的合成5.5.6 无效链接检查5.6 实验分析5.6.1 对重叠文档的两种假设5.6.2 PMSRM与单独搜索引擎比较5.6.3 PMSRM与几种常用合并算法比较5.7 本章小结第六章 总结与展望6.1 论文总结6.2 研究展望致谢参考文献读研期间研究成果
相关论文文献
标签:信息检索论文; 元搜索论文; 摘要法论文; 用户兴趣论文; 搜索结果合成论文;