基于多因素的引文推荐策略研究

基于多因素的引文推荐策略研究

论文摘要

随着信息传播速度的快速提升,可供查阅的科技文献数量也在迅速增加。用户想要在上千条引文查询结果中找到自己需要的结果是一件很困难的事情。查询结果推荐是解决这个问题的方法之一。查询结果推荐根据已有的用户信息,预测出用户可能感兴趣的项目,将这些项目推荐给用户,避免了用户从搜索工具中返回的数量巨大的结果集中挑选结果,减轻了用户的负担。由于引文之间的题目相似度不能准确反映引文之间的相似度,现有的查询结果推荐方法不能很好的对引文做出推荐。本文基于引文自身的特点,提出了一种基于多因素的引文推荐策略。该策略综合了引文自身因素和用户因素进行论文推荐。首先,根据引文的引用关系,生成一个引文引用图。接着,根据同作者、共同引用等引文之间特殊的联系定义一系列规则,并基于这些规则给引用边赋权值,权值的大小表示引文之间联系的强弱。之后,应用聚类算法对联系紧密的引文进行聚类,并根据聚类结果,找出用户需要的相关引文,生成初始的引文推荐集合。最后,找出当前用户的相似用户,根据它们的行为对之前生成的推荐集合进行调整,生成最终的引文推荐集合。本文主要研究以下几个问题。一是将用户协同过滤策略和基于项目的推荐策略结合起来,提出一个引文推荐模型。在初期用户评分稀疏的情况下,利用项目之间的相似度进行推荐。在系统运行一段时间之后,根据用户的评价对之前计算的相似度进行调整,使结果更准确。二是在计算项目相似度的时候,根据引文自身的属性计算(引用关系、作者、发表时间等),而不是传统的语义相似度。这样,可以避免抽取和语义分析的不准确。三是改进了用户-项目评分矩阵的生成方法,解决了传统用户协同过滤策略存在的一些问题。文中通过大量实验对比,验证了我们提出的基于多因素的引文推荐方法在性能上要优于现有的推荐方法,使得在WebCitation系统中,对目标引文做出的引文推荐集合符合用户的需要,减少了用户的操作负担。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 课题背景
  • 1.2 引文推荐问题的提出
  • 1.3 国内外研究现状
  • 1.4 本文的组织结构
  • 第2章 相关概念与技术
  • 2.1 推荐系统定义
  • 2.2 推荐系统的结构框架
  • 2.3 推荐系统分类
  • 2.3.1 根据个性化程度分类
  • 2.3.2 根据实现技术分类
  • 2.4 相似度量
  • 2.4.1 余弦相似性
  • 2.4.2 相关相似性
  • 2.4.3 修正的余弦相似性
  • 2.5 推荐系统常见问题
  • 2.6 用户建模技术
  • 2.6.1 用户数据分类
  • 2.6.2 用户模型表示
  • 2.7 信息过滤技术
  • 2.8 本章小结
  • 第3章 引文推荐模型
  • 3.1 引文推荐动机
  • 3.2 引文推荐模型
  • 3.3 引文推荐策略概述
  • 3.4 推荐策略的改进与扩展
  • 3.4.1 基于项目的推荐策略
  • 3.4.2 用户协同过滤策略
  • 3.5 本章小结
  • 第4章 基于引文的推荐策略
  • 4.1 引文相似度计算
  • 4.1.1 传统相似度计算的不足
  • 4.1.2 引文关系图
  • 4.1.3 各种因素对引文相似度影响
  • 4.2 聚类分析
  • 4.2.1 聚类分析概述
  • 4.2.2 基于层次的聚类
  • 4.2.3 BHC(Basic Hierarchical Clustering)算法
  • 4.2.4 K-BHC算法
  • 4.3 生成备选推荐
  • 4.4 本章小结
  • 第5章 改进的用户协同过滤策略
  • 5.1 传统的用户协同过滤策略
  • 5.2 改进用户相似度计算
  • 5.2.1 用户评分
  • 5.2.2 用户相似度计算
  • 5.3 用户协同推荐算法扩展性
  • 5.4 改进用户协同过滤策略
  • 5.5 本章小结
  • 第6章 实验分析
  • 6.1 实验环境设置
  • 6.2 实验结果及分析
  • 6.3 本章小结
  • 第7章 总结与展望
  • 7.1 本文的主要工作
  • 7.2 未来研究工作
  • 参考文献
  • 致谢
  • 攻硕期间科研及发表论文情况
  • 相关论文文献

    • [1].基于专利科学引文内容表示学习的科学技术主题关联分析研究[J]. 数据分析与知识发现 2019(12)
    • [2].中文文献引文情感语料库构建[J]. 情报学报 2020(01)
    • [3].基于引文分析的诺贝尔奖级科学家遴选——科睿唯安“引文桂冠奖”详解[J]. 世界科技研究与发展 2019(05)
    • [4].基于非平衡学习与交互式标注的引文情感动机标注系统[J]. 软件工程 2020(07)
    • [5].引文伦理研究[J]. 四川警察学院学报 2016(04)
    • [6].面向科学技术创新的科学引文网络研究[J]. 合肥工业大学学报(社会科学版) 2016(06)
    • [7].利用引文内容监测多学科交叉现象的方法与实证[J]. 图书情报工作 2016(19)
    • [8].基于样本加权的引文网络的社团划分[J]. 图书情报工作 2016(20)
    • [9].基于节点内容及拓扑结构的引文网络社团划分[J]. 图书情报知识 2017(01)
    • [10].学术文献引文上下文自动识别研究[J]. 图书情报工作 2016(17)
    • [11].科技引文行为的影响因素分析[J]. 情报理论与实践 2017(04)
    • [12].开放引文语料库实践案例及启示[J]. 数字图书馆论坛 2017(07)
    • [13].医学期刊常见的引文缺失与引文不当现象浅析[J]. 传播与版权 2017(05)
    • [14].从态度、意愿到行为:人文社会科学领域引文行为的形成路径分析[J]. 现代情报 2017(09)
    • [15].基于引文上下文的相关研究辅助生成系统设计与实现[J]. 数字图书馆论坛 2017(08)
    • [16].学术专著引用行为研究——基于引文内容特征分析的视角[J]. 情报学报 2017(03)
    • [17].引文网络的社团划分研究进展综述[J]. 情报杂志 2016(04)
    • [18].日本汉文古辞书引文模式研究——以《倭名类聚抄》为例[J]. 中国文字研究 2019(02)
    • [19].引文切忌张冠李戴[J]. 学语文 2008(01)
    • [20].基于引文曲线拟合的新兴技术主题的突破性预测——以干细胞领域为例[J]. 图书情报工作 2020(05)
    • [21].基于引文出版年光谱的SARS研究起源与演化[J]. 中华医学图书情报杂志 2020(04)
    • [22].引用内容分析与引文著录分析的比较研究[J]. 图书情报工作 2017(10)
    • [23].图情领域中网络引文现状的调查与分析[J]. 创新科技 2016(02)
    • [24].考虑引文质量的影响因子在高校学报评价中的应用——以福建地区四所高校为例[J]. 中国科技期刊研究 2016(06)
    • [25].网络引文研究现状及分析[J]. 苏州市职业大学学报 2014(04)
    • [26].图书馆学研究文献网络引文的可追溯性考察——以四种核心期刊为例[J]. 图书馆 2015(04)
    • [27].引文上下文在文献内容分析中的应用[J]. 情报科学 2015(05)
    • [28].学术文献引文推荐研究进展[J]. 图书情报工作 2015(15)
    • [29].引文评价合法性研究——基于引文功能和引用动机研究的综合考察[J]. 南京大学学报(哲学.人文科学.社会科学版) 2013(06)
    • [30].引文数据质量控制研究[J]. 图书馆建设 2014(09)

    标签:;  ;  ;  

    基于多因素的引文推荐策略研究
    下载Doc文档

    猜你喜欢