论文摘要
信息技术和网络技术的迅速发展,在给科研人员带来极大便利的同时,也产生了“信息过载”和“信息迷向”等问题,可用的科研文献的急剧增长增大了科研人员及时获取相关文献的难度;由于科研人员之间缺乏有效的共享机制和交流手段,他们常常为了获取相同的科研文献重复搜索,导致科研工作效率低下。目前科研人员主要使用各种科研文献管理软件来组织和管理科研文献,每个科研人员拥有一个文献库。若将所有科研人员的个人文献库连接起来,形成一个大文献库,一方面能够用于科研文献共享;另一方面,可以通过对科研人员个人文献库的处理和挖掘得到某些个性化信息(如兴趣等),提高文献搜索的准确率。本文深入分析了目前科研人员使用的文献搜索、共享方法,科研人员间交流方法,提出了以科研人员个人文献库为基础,由科研人员组成的构建于底层对等网络拓扑之上的科研社会网络,为科研人员提供一个文献交流和共享的平台,帮助科研人员及时获取科研文献。构建科研社会网络首先要对每个科研人员建立用户兴趣模型。本文从科研社会网络的实际需求及科研群体的特点出发,在充分研究现有用户兴趣建模技术及个性化推荐技术的基础上,对现有算法和技术加以改进,提出了基于向量空间模型的用户兴趣建模算法,建立科研人员兴趣模型和科研文献的兴趣倾向模型,通过实验对算法进行了验证,给出了实验数据集、步骤和结果以及实验分析。实验结果表明,基于向量空间模型的用户兴趣建模算法建立的用户兴趣模型基本准确,能够反映用户兴趣,但是还存在诸如稳定性不高等缺点。从复杂网络的角度出发,基于用户兴趣模型,本文研究了以科研人员为节点,科研人员之间的关系为边的科研社会网络,给出了科研社会网络的拓扑构建算法,分为静态网络生成、新节点加入和网络演化三个阶段。算法通过底层Kademlia采样网络和用户兴趣模型相似度共同决定节点拓扑的演化过程。通过仿真实验验证了拓扑构建算法的有效性,给出了实验的背景和数据集、实验方法和步骤,依据实验结果分析了科研社会网络的度分布、网络直径和聚类系数三个特征参数,实验结果表明,科研社会网络是一个小世界网络。最后,本文分析了科研社会网络的需求、设计了科研社会网络的体系结构和模块,实现了一个覆盖于底层Kademlia采样网络之上的科研社会网络的原型系统。