基于PageRank排序算法改进的若干研究

基于PageRank排序算法改进的若干研究

论文摘要

全球资讯量最大,查询次数最多,知名度最高的搜索引擎是Google,而Google使用最久的排名算法就是PageRank排名算法。PageRank算法被广泛应用于度量网页重要性,它根据网页之间的链接结构来给每个网页打分,依据分数高低给出排名先后,从数学的角度来解释,可以被看作是一个马尔可夫随机游走模型,依据网页下一步的链接信息计算网页的转移概率,用马氏链的平稳分布作为最终的值给网页排序。传统PageRank算法利用了Web的结构信息来判断网页的重要性,而且计算排名过程中将同一页面的所有链出页面看成同等重要,即对每个链出页面平均分配其PageRank值,本文认为这是传统PageRank算法的一个致命缺陷。本文通过分析传统PageRank算法的思想——每个链入页面看做是给自己“投票”的页面、重要页面的投票重要性高、票数多少决定页面重要性高低,得知同一页面的每个链出页面应根据其重要性的不同分得不同权重,从而给出了具有针对性的改进算法。理论上改进算法更切合传统PageRank算法的思想;通过Matlab实验迭代结果,比较传统PageRank算法和改进算法的计算结果,证明改进算法提升重要网页的PageRank值,降低不重要网页的PageRank值,而且能用d<0.85的d值达到传统PageRank算法计算的PageRank值。数值分析中,一个数值问题的条件数是该数量在数值计算中的容易程度的衡量,也就是该问题的适定性。一个低条件数的问题称为“良态”的,而高条件数的问题称为“病态”的。由于互联网上有成亿的网页,实际中计算排名不是解方程组而是用计算机模拟迭代计算其近似解,若一个方程组的病态程度愈严重,也就愈难用一般的计算方法求得比较准确的解。本文在第四章中通过讨论矩阵的条件数,分析其近似解的误差,证明降低阻尼因子d值能使求马氏链极限分布这个数值问题的条件数降低,即马氏链极限分布的近似解更精确。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究的背景
  • 1.2 目前国内外研究现状
  • 1.3 本文的主要研究内容
  • 1.4 本文的组织
  • 第二章 马氏(Markov)链
  • 2.1 马氏链的定义及性质
  • 2.2 状态的分类
  • 2.3 状态空间的分解
  • 2.4 P"的极限性态与平稳分布
  • 第三章 传统PageRank算法
  • 3.1 算法解析
  • 3.2 解PageRank值
  • 第四章 PageRank新算法
  • 4.1 传统PageRank算法缺陷
  • 4.2 算法改进思想
  • 4.3 初步实验结论
  • 4.4 实验验证
  • 4.5 小结
  • 第五章 误差分析
  • 5.1 矩阵的条件数
  • 5.2 分析解PageRank值的条件数
  • 5.3 提高近似解精度
  • 5.4 小结
  • 第六章 结论与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 附录
  • 相关论文文献

    • [1].网络结构对专利PageRank与专利价值关系的门槛效应研究[J]. 科学学与科学技术管理 2020(02)
    • [2].基于叙词表语义关系和PageRank的查询扩展方法[J]. 情报杂志 2016(12)
    • [3].基于社交网络的PageRank算法改进[J]. 图书情报导刊 2017(04)
    • [4].圆圈结构及其变化系统的PageRank排名研究[J]. 计算机工程与应用 2017(09)
    • [5].Ranking Modules for Integrate Testing Based on PageRank Algorithm[J]. Chinese Journal of Electronics 2017(05)
    • [6].基于改进PageRank算法的路网重要交叉口筛选方法[J]. 西南交通大学学报 2016(05)
    • [7].基于洛伦兹变换和PageRank算法的数据资产估值[J]. 计算机系统应用 2020(08)
    • [8].高阶PageRank问题的一个两步分裂迭代算法[J]. 应用数学与计算数学学报 2018(03)
    • [9].基于PageRank算法的出租车需求预测[J]. 微型电脑应用 2019(04)
    • [10].基于关系网络的PageRank算法在禁毒情报上的应用研究[J]. 中国人民公安大学学报(自然科学版) 2019(01)
    • [11].基于PageRank的微博用户影响力算法研究[J]. 计算机应用研究 2018(04)
    • [12].PageRank算法改进研究[J]. 软件导刊 2017(02)
    • [13].面向微博的PageRank算法的改进与应用[J]. 计算机应用与软件 2017(03)
    • [14].基于PageRank算法的网络关键节点查找[J]. 电脑知识与技术 2017(04)
    • [15].基于PageRank算法的图书影响力评价[J]. 中华医学图书情报杂志 2015(12)
    • [16].An adaptive improvement on PageRank algorithm[J]. Applied Mathematics:A Journal of Chinese Universities(Series B) 2013(01)
    • [17].加权PageRank算法研究综述[J]. 软件导刊 2013(02)
    • [18].PageRank在图书推荐技术中的应用研究[J]. 科技通报 2013(04)
    • [19].一种基于PageRank算法和知网的词义消歧方法[J]. 计算机应用与软件 2011(05)
    • [20].个性化PageRank算法在图书馆智能搜索引擎中的实现[J]. 现代情报 2010(07)
    • [21].PageRank算法在孤立点检测中的应用[J]. 微型机与应用 2010(24)
    • [22].基于PageRank的期刊评价研究[J]. 中国科技期刊研究 2009(04)
    • [23].基于转移概率的PageRank算法研究[J]. 科学技术与工程 2008(08)
    • [24].基于改进PageRank算法的轨道交通产业集群分析[J]. 交通运输工程与信息学报 2020(02)
    • [25].基于PageRank的用户影响力评价改进算法[J]. 哈尔滨工业大学学报 2018(05)
    • [26].基于PageRank的微博用户影响力评估模型研究[J]. 信息技术 2018(05)
    • [27].基于分布式PageRank算法的可疑目标挖掘[J]. 高技术通讯 2017(05)
    • [28].基于万有引力定律和PageRank的页面分类系统构建方法研究[J]. 情报科学 2015(06)
    • [29].基于中心词耦合度和PageRank的文本自动摘录算法[J]. 中山大学研究生学刊(社会科学版) 2013(03)
    • [30].一种融合PageRank的协同过滤帖子推荐方法[J]. 中国科学技术大学学报 2014(07)

    标签:;  ;  ;  ;  ;  

    基于PageRank排序算法改进的若干研究
    下载Doc文档

    猜你喜欢