论文摘要
随着互联网的迅速发展,网上信息资源快速增长,人们面对太多的信息无法选择和消化。Internet上信息资源分布的广泛性和高度无序性给用户寻找感兴趣的信息增加了很大困难。由于当前的搜索引擎具有通用的性质,因此很难满足不同背景、不同目的和不同时期用户的查询请求。用户的信息需求一般具有个性化的特征,这些信息需求是相对稳定的、时间相对长久的,当然也会随着时间的变化而不断变化的。因此用户期待着能够适应个性化信息需求的信息服务软件的出现。个性化推荐服务技术已经成为当前信息检索领域的研究热点之一。所谓个性化服务就是指对不同的用户采取不同的推荐服务模型,提供不同的搜索内容,其关键在于知道用户的兴趣,并准确地建立用户兴趣模型。用户兴趣模型是否准确地反映用户的兴趣决定了系统提供个性化推荐服务的质量。本文提出了一种基于搜索结果聚类分析的个性化推荐模型,首先对当前主要的web挖掘技术和用户兴趣建模技术进行了探讨,提出了以用户浏览教学科研信息内容的分析为主和以用户浏览行为分析为辅的用户兴趣模型。然后,对文档的表示技术进行了研究,包括文本的向量空间模型表示、特征项的选择,将文本表示为结构化的向量空间模型。文档内容与用户兴趣模型的比较就可以采用常用的相似性函数来进行相似度计算。再利用多种信息的融合算法对搜索结果重新排序,对结果进行聚类分析,调整不同类别文档的权重后进行自适应推荐。最后,对上述改进方法做了较为全面的实验。根据教学科研信息推送实验结果分析表明,本文提出的用户兴趣模型能较准确地描述用户兴趣所在,在个性化推送服务中具有实际应用价值。基于结果聚类分析的个性化推荐模型能更好地提高推荐效果。本文的创新点就是把用户的行为记录后转化为用户兴趣模型的反馈信息,自适应的为用户推荐教学科研信息。