论文摘要
数字图书馆不仅仅为读者提供实用的信息资源,还需要对于不同的用户提供个性化的信息服务,以提升数字图书馆的服务质量和水平,提高资源信息的利用率。随着信息技术和网络技术的发展,以及图书馆的数字资源越来越丰富和完善,这一切都成为可能。本文根据数字图书馆的个性化服务的需求,提出了一种基于Web的数字图书馆个性化服务机制及其相关算法。主要工作如下:1.本文对数据挖掘领域中的Web挖掘技术所涵盖的理论做了比较深入的分析和阐述。在分析当前提供个性化服务的内涵、特征和方式的基础上,指出了目前解决图书馆个性化信息服务中尚存的问题。2.针对传统的协同过滤算法中存在数据稀疏性和冷启动的不足,提出了基于用户兴趣传播的协同过滤算法。在这个算法当中不仅解决用户的兴趣的相似性计算问题,又考虑到了其他的邻居的用户对于目标用户的兴趣的偏好的影响。在数据稀疏性的情况下保证了算法的有效性。仿真实验说明算法具有可行性和有效性。3.设计并实现基于Web日志挖掘的个性化推荐系统原型。采用改进的Apriori算法对数据预处理阶段得到的事务数据库进行频繁访问模式的挖掘并生成关联规则。根据频繁访问模式和关联规则自动生成推荐内容,在线提供给用户。通过对建立用户兴趣模型库所涉及到的各项技术内容的分析,设计了基于自动建模技术、向量空间模型表示法和相应的数据挖掘算法的用户兴趣模型库。4.本文提出了在线和离线部分分离设计、融合实现个性化推荐的设计思想,分析了系统从数据准备、数据收集和对用户兴趣模型的建立到在线推荐引擎产生结果的推荐集,最后实现了各个模块的功能设计。本文针对当今数字图书馆个性化信息服务系统中存在的问题,考虑到用户兴趣传播的协同性问题,使其适应用户个性化需求,更好地提高图书馆资源利用率。对系统进行了测试,测试结果表明系统能满足用户的需求,其整体性能实现了系统预期的设计目标。