迅雷资源搜索引擎的研究与实现

迅雷资源搜索引擎的研究与实现

论文摘要

多媒体资源搜索引擎是搜索引擎发展的方向之一,创建出好的多媒体资源搜索引擎能全面、准确、快速的搜索出多媒体文件,对提高互联网的利用率,增加人们对互联网的信心有十分重要的意义。 搜索引擎搜索出来的结果是网页,而多媒体资源搜索引擎搜索出来的结果是多媒体文件。这两类系统的相同点是具有大致相同的组成部分,即都是由网络蜘蛛、索引器、检索器和用户接口四个部分组成;不同点是网络蜘蛛对于前者抓取的是网页,而对于后者抓取的是多媒体文件。 论文研究的重点是迅雷多媒体资源搜索引擎的原理及实现,具体研究的内容包括以下五个部分。(1)迅雷资源搜索引擎网络蜘蛛的实现,包括在互联网中抓取文件并且对文件的内容做摘要生成文件的唯一标识CID,使用配模板进行网络文件的抓取。(2)迅雷资源搜索引擎索引器的实现,主要是如何建立中文分词和倒排表。(3)迅雷资源搜索引擎检索器和用户接口的实现。(4)迅雷资源搜索系统中采用的较新的标签技术和反馈机制,通过标签技术和反馈机制,使搜索引擎的准确性得到较大幅度的提高。(5)迅雷资源搜索引擎采用了一些优化措施,包括资源自动推荐、关键字智能辨析、资源排列方式、搜索特定类型的文件等。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 论文组织结构
  • 第二章 搜索引擎的产生、发展及趋势
  • 2.1 搜索引擎的产生
  • 2.1.1 什么是搜索引擎
  • 2.1.2 最早的搜索引擎
  • 2.2 搜索引擎的发展及分类
  • 2.2.1 搜索引擎的发展
  • 2.2.2 搜索引擎的分类
  • 2.3 搜索引擎的发展趋势
  • 2.3.1 垂直搜索引擎
  • 2.3.2 即时信息搜索引擎
  • 2.3.3 多媒体资源搜索引擎
  • 2.4 小结
  • 第三章 搜索引擎的原理及实现
  • 3.1 搜索引擎的工作原理
  • 3.1.1 搜索引擎的组成
  • 3.1.2 搜索引擎的工作流程
  • 3.2 搜索器
  • 3.2.1 网络蜘蛛的实现
  • 3.2.2 网页的更新周期
  • 3.2 索引器
  • 3.2.1 索引器概述
  • 3.2.2 中文分词
  • 3.2.3 倒排索引
  • 3.3 检索器
  • 3.3.1 检索器概述
  • 3 3.2 Google的PageRank
  • 3.3.3 检索器的实现
  • 3.4 用户接口
  • 3.5 小结
  • 第四章 资源搜索引擎研究
  • 4.1 传统的检索多媒体资源的方法
  • 4.2 基于内容的多媒体资源检索
  • 4.3 迅雷资源搜索引擎
  • 4.4 多媒体资源搜索的展望
  • 4.5 小结
  • 第五章 迅雷资源搜索引擎的实现
  • 5.1 迅雷资源搜索引擎实现原理图
  • 5.2 迅雷资源搜索引擎的网络蜘蛛
  • 5.2.1 抓取文件的一部分作为唯一标识
  • 5.2.2 配模板
  • 5.2.3 不抓取的站点
  • 5.2.4 网页的更新
  • 5.3 迅雷资源搜索引擎的索引器
  • 5.3.1 中文分词
  • 5.3.2 倒排表
  • 5.4 迅雷资源搜索引擎的检索器
  • 5.5 迅雷资源搜索引攀的用户接口
  • 5.5.1 层叠样式表 CSS(Cascading Style Sheet)技术
  • 5.5.2 搜索范围的选择
  • 5.6 迅雷资源搜索引攀中的用户标签
  • 5.6.1 标签技术简介
  • 5.6.2 迅雷用户标签
  • 5.7 迅雷资源搜索引擎中的反馈机制
  • 5.8 迅雷资源搜索引擎的其他一些优化措施
  • 5.8.1 相关资源自动推荐
  • 5.8.2 关键字智能辨析
  • 5.8.3 资源排列方式
  • 5.8.4 搜索特定类型的文件
  • 5.9 小结
  • 第六章 结束语
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读硕士期间所发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    迅雷资源搜索引擎的研究与实现
    下载Doc文档

    猜你喜欢