论文摘要
随着信息技术的发展,特别是因特网应用的普及,出现了“信息超载”和“知识迷向”等问题。如何管理互联网上的大量信息,以适应用户不断增长的个性化的信息需求,是研究人员面临的新课题,个性化服务技术已经成为当前信息服务领域的研究热点之一。用户建模作为个性化服务的关键技术,逐步成为研究的重点。结合科技文献共享服务的特点,通过构建计算机领域词汇的语义集成本体,建立基于语义的用户多兴趣模型来挖掘用户兴趣,并进行个性化服务。语义集成本体以语义涵盖树为主体,记载着与主词节点的相关词汇和相似词汇。该模型将用户浏览和下载的信息当作挖掘对象,从用户使用系统的过程中挖掘出用户的兴趣主题。用户兴趣文本经预处理后,提取出用户兴趣特征词,通过该语义集成本体扩展出同义词和相关词,使模型更加全面准确地描述用户兴趣,并从语义上理解用户的兴趣主题和查询要求。模型将用户兴趣细分为稳定和临时兴趣,并划分多个类别,采用“用户-兴趣类别-兴趣特征”树形结构来表示用户兴趣,构建多兴趣类别的用户模型。模型中引入时间因子,并赋予相应的兴趣特征和兴趣类别合适的权值,适时获取用户兴趣特征,并分门别类进行管理。采用自适应动态更新算法对模型不断的更新与优化,参照遗忘规律对用户的历史兴趣区分兴趣类别实施非线性的淘汰,逐步明确用户的兴趣主题。在个性化服务中,根据获取的用户兴趣,检索出用户感兴趣的内容推荐给用户,完成个性化信息推荐服务。最后通过收集用户信息和访问记录,模拟用户和用户浏览行为来测试用户模型的建立和更新,通过个性化信息推荐和查询的结果验证了系统的有效性。