论文摘要
多媒体资源搜索引擎是搜索引擎发展的方向之一,创建出好的多媒体资源搜索引擎能全面、准确、快速的搜索出多媒体文件,对提高互联网的利用率,增加人们对互联网的信心有十分重要的意义。 搜索引擎搜索出来的结果是网页,而多媒体资源搜索引擎搜索出来的结果是多媒体文件。这两类系统的相同点是具有大致相同的组成部分,即都是由网络蜘蛛、索引器、检索器和用户接口四个部分组成;不同点是网络蜘蛛对于前者抓取的是网页,而对于后者抓取的是多媒体文件。 论文研究的重点是迅雷多媒体资源搜索引擎的原理及实现,具体研究的内容包括以下五个部分。(1)迅雷资源搜索引擎网络蜘蛛的实现,包括在互联网中抓取文件并且对文件的内容做摘要生成文件的唯一标识CID,使用配模板进行网络文件的抓取。(2)迅雷资源搜索引擎索引器的实现,主要是如何建立中文分词和倒排表。(3)迅雷资源搜索引擎检索器和用户接口的实现。(4)迅雷资源搜索系统中采用的较新的标签技术和反馈机制,通过标签技术和反馈机制,使搜索引擎的准确性得到较大幅度的提高。(5)迅雷资源搜索引擎采用了一些优化措施,包括资源自动推荐、关键字智能辨析、资源排列方式、搜索特定类型的文件等。
论文目录
摘要ABSTRACT目录第一章 绪论1.1 研究背景及意义1.2 国内外研究现状1.3 论文组织结构第二章 搜索引擎的产生、发展及趋势2.1 搜索引擎的产生2.1.1 什么是搜索引擎2.1.2 最早的搜索引擎2.2 搜索引擎的发展及分类2.2.1 搜索引擎的发展2.2.2 搜索引擎的分类2.3 搜索引擎的发展趋势2.3.1 垂直搜索引擎2.3.2 即时信息搜索引擎2.3.3 多媒体资源搜索引擎2.4 小结第三章 搜索引擎的原理及实现3.1 搜索引擎的工作原理3.1.1 搜索引擎的组成3.1.2 搜索引擎的工作流程3.2 搜索器3.2.1 网络蜘蛛的实现3.2.2 网页的更新周期3.2 索引器3.2.1 索引器概述3.2.2 中文分词3.2.3 倒排索引3.3 检索器3.3.1 检索器概述3 3.2 Google的PageRank3.3.3 检索器的实现3.4 用户接口3.5 小结第四章 资源搜索引擎研究4.1 传统的检索多媒体资源的方法4.2 基于内容的多媒体资源检索4.3 迅雷资源搜索引擎4.4 多媒体资源搜索的展望4.5 小结第五章 迅雷资源搜索引擎的实现5.1 迅雷资源搜索引擎实现原理图5.2 迅雷资源搜索引擎的网络蜘蛛5.2.1 抓取文件的一部分作为唯一标识5.2.2 配模板5.2.3 不抓取的站点5.2.4 网页的更新5.3 迅雷资源搜索引擎的索引器5.3.1 中文分词5.3.2 倒排表5.4 迅雷资源搜索引擎的检索器5.5 迅雷资源搜索引攀的用户接口5.5.1 层叠样式表 CSS(Cascading Style Sheet)技术5.5.2 搜索范围的选择5.6 迅雷资源搜索引攀中的用户标签5.6.1 标签技术简介5.6.2 迅雷用户标签5.7 迅雷资源搜索引擎中的反馈机制5.8 迅雷资源搜索引擎的其他一些优化措施5.8.1 相关资源自动推荐5.8.2 关键字智能辨析5.8.3 资源排列方式5.8.4 搜索特定类型的文件5.9 小结第六章 结束语6.1 总结6.2 展望参考文献攻读硕士期间所发表的论文致谢
相关论文文献
标签:资源搜索引擎论文; 网络蜘蛛论文; 索引器论文; 标签技术论文;