搜索引擎分析 ——基于PageRank算法的研究与改进

搜索引擎分析 ——基于PageRank算法的研究与改进

论文摘要

伴随互联网爆炸性的发展,网上信息浩如烟海,普通网络用户想找到所需的资料难于大海捞针,所以迫切需要一种优异的搜索服务,将网上繁杂的内容整理成为可方便获取的信息。搜索引擎技术为解决这一难题做出了突出贡献,搜索引擎提供的结果集中页面质量的好坏以及高质量的页面能否在结果集中有较好的排名,对搜索引擎用户来说具有重要意义,同时也是衡量搜索引擎技术优劣的关键指标,所以对页面进行重要性评估并按重要性排序是搜索引擎要解决的技术核心。本文首先介绍了搜索引擎的组成、原理、工作流程以及发展现状,分析了其存在的优缺点;然后对Web挖掘的三个方面:内容挖掘、结构挖掘和使用挖掘做了简要分析。其次,本文在介绍PageRank与HITS两种基于链接结构的搜索引擎排序算法的基础上,就链接和被链接的数量、对象以及Web自身的链接结构模式对这两种算法进行了对比分析,并重点研究了PageRank算法的思想和计算方法。最后,通过深入分析PageRank算法后,本文提出了改进的SP-PageRank算法,并对算法所用到的内外存交换原理做了比较深入的研究,利用Java语言实现了基于数据预取的PageRank与SP-PageRank计算平台。在搜狗实验室提供的3个链接数据集上进行了实验,实验结果表明,基于数据预取的PageRank与SP-PageRank算法比未使用数据预取的时候在计算效率上有较大提高。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 1 引言
  • 1.1 研究背景和意义
  • 1.2 本文的主要工作
  • 1.3 论文的组织结构
  • 2 搜索引擎及Web挖掘综述
  • 2.1 搜索引擎的发展历史和分类
  • 2.2 搜索引擎的基本组成
  • 2.3 搜索引擎的性能指标及发展趋势
  • 2.4 Web挖掘理论基础
  • 3 基于链接结构的搜索引擎排序算法研究
  • 3.1 HITS算法
  • 3.1.1 算法原理及描述
  • 3.1.2 算法存在的问题
  • 3.2 PageRank算法
  • 3.2.1 算法原理
  • 3.2.2 算法描述
  • 3.2.3 算法存在的问题
  • 3.2.4 PageRank的改进算法
  • 3.3 HITS算法与PageRank算法的比较分析
  • 3.3.1 算法思想
  • 3.3.2 权重的传播模型
  • 3.3.3 处理的数据量及用户端等待时间
  • 4 PageRank的改进算法SP-PageRank
  • 4.1 PageRank算法的优化策略
  • 4.2 基于数据预取的PageRank计算平台
  • 4.2.1 内外存交换技术简介
  • 4.2.2 数据预取简介
  • 4.2.3 PageRank计算平台
  • 4.3 SP-PageRank算法
  • 4.3.1 算法思想
  • 4.3.2 算法介绍
  • 4.3.3 算法流程
  • 4.3.4 基于数据预取的SP-PageRank算法
  • 4.4 小结
  • 5 实验结果及分析
  • 5.1 实验环境及数据集说明
  • 5.1.1 实验环境
  • 5.1.2 实验数据集描述
  • 5.2 数据预取实验
  • 5.3 基于数据预取的PageRank实验
  • 5.4 基于数据预取的SP-PageRank实验
  • 6 结语
  • 参考文献
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    • [1].打造网页设计创新创业示范课程[J]. 河南教育(职成教) 2019(12)
    • [2].网页设计中计算机图像处理技术的应用[J]. 无线互联科技 2019(21)
    • [3].高职院校网页设计与制作课程教学改革研究[J]. 教育现代化 2019(95)
    • [4].浅谈网页设计与制作课程[J]. 电脑知识与技术 2020(01)
    • [5].浅析水墨元素融入网页设计的架构技巧[J]. 辽宁经济职业技术学院.辽宁经济管理干部学院学报 2019(06)
    • [6].分析计算机图像处理技术在网页设计中的应用价值[J]. 计算机产品与流通 2020(01)
    • [7].网页设计中计算机图像处理技术的应用[J]. 电子技术与软件工程 2019(24)
    • [8].“环球佳”医疗设备企业网页设计[J]. 出版发行研究 2019(12)
    • [9].网页设计在视觉传达设计中表现的形式[J]. 西部皮革 2020(03)
    • [10].论网页设计中计算机图像处理技术的应用[J]. 计算机产品与流通 2020(02)
    • [11].色彩节奏在网页设计中的应用研究[J]. 计算机产品与流通 2020(02)
    • [12].计算机图像处理技术在网页设计中的应用分析[J]. 电子世界 2020(04)
    • [13].网页设计中计算机图像处理技术的应用[J]. 科技风 2020(11)
    • [14].网页设计作品[J]. 上海纺织科技 2020(01)
    • [15].浅析网页设计中的色彩搭配[J]. 农家参谋 2020(01)
    • [16].党政网页电子文件采集与管理研究[J]. 办公室业务 2020(04)
    • [17].基于翻转课堂的《商务网页设计与制作》课程设计研究[J]. 中国多媒体与网络教学学报(中旬刊) 2020(03)
    • [18].水墨动画在网页设计中的应用思考[J]. 中外企业家 2020(12)
    • [19].网页设计中的色彩搭配探讨[J]. 信息与电脑(理论版) 2020(02)
    • [20].浏览器的神奇玩法[J]. 计算机与网络 2020(04)
    • [21].网页欣赏精品分析教学平台的设计[J]. 黑龙江科学 2020(07)
    • [22].关于网页设计与制作方法与应用的探讨[J]. 河北农机 2020(03)
    • [23].基于修辞资源与受众的高校网页简介英译失误分析——以东南地区部分985高校为例[J]. 黑龙江教师发展学院学报 2020(04)
    • [24].关于“网页设计与制作”教学的中高职衔接问题初探[J]. 电脑知识与技术 2020(09)
    • [25].网页设计中计算机图像处理技术的应用[J]. 中外企业家 2020(16)
    • [26].网页档案信息长期保存策略研究[J]. 档案时空 2019(12)
    • [27].中职《网页设计与制作》课程教学综述[J]. 信息记录材料 2020(03)
    • [28].基于眼动跟踪的教育网页“优势区域”论证研究[J]. 现代计算机 2020(13)
    • [29].基于校企合作的《网页设计》课程教学改革研究[J]. 科技创新导报 2019(31)
    • [30].计算机网页设计中的布局与排版[J]. 信息与电脑(理论版) 2020(09)

    标签:;  ;  

    搜索引擎分析 ——基于PageRank算法的研究与改进
    下载Doc文档

    猜你喜欢