论文摘要
本文从全文检索技术的产生、发展和应用入手,深入探讨了全文检索的基本原理、方法和特点。通过对全文检索引擎Lucene系统结构、索引结构及数据流程的深入研究,详细剖析了全文检索系统的开发和应用。Google在2004年推出了自己的桌面搜索软件——Google Desktop,她是基于Google强大技术优势的基础上开发出来的,最大的优势就是不仅可以把它直接当作工具软件使用,还可以在它的基础上进行二次开发,设计出满足自己需求的搜索软件。Google桌面和以往的一些搜索引擎和检索系统开发包相比较有着诸多明显的优势。本文意在基于Google Desktop,利用其提供的SDK(软件开发包)开发一种全新的全文检索系统,并将自己开发的索引插件(index plugin)嵌入该系统,从而进一步提高全文检索系统的搜索能力。本文的重点放在了全文检索在教育资源库上的应用,通过全文检索技术、Google搜索技术和改进的索引创建策略的结合,开发一个基于Web的教育资源库全文检索系统。该全文检索系统不仅可以快速检索教育资源库中已存在文件类型的资源,而且随着教育资源库的扩充,还可以随时使系统增加新文件类型的检索能力,不断扩充系统的功能。从实验结果来看,该系统基本达到了设计的初衷。
论文目录
摘要ABSTRACT1 引言1.1 背景及研究现状1.2 研究目的和意义1.3 论文创新点1.4 论文结构2 全文检索技术概述2.1 信息检索概述2.1.1 信息检索的起源与发展2.1.2 信息检索分类2.2 全文检索技术概述2.3 全文检索基本原理2.4 全文数据库2.4.1 全文数据库的特点2.4.2 全文数据库的功能2.4.3 全文数据库的构建2.5 本章小结3 全文检索系统的分析研究3.1 几种常用的全文检索系统开发工具3.1.1 Microsoft Index Server 站点索引工具3.1.2 Lucene 全文检索引擎3.1.3 Google 桌面3.1.4 几种常见全文检索系统构建工具对比3.2 LUCENE 全文检索引擎研究3.2.1 Lucene 的应用、特点3.2.2 系统结构组织3.2.3 数据流分析3.2.4 Lucene 索引文件格式分析3.2.5 基于Lucene 的应用开发3.2.6 从Lucene 学到的3.2.7 Lucene 与Google Desktop Search 的对比3.3 全文检索系统架构分析3.4 本章小结4 GOOGLE DESKTOP SDK 的分析研究4.1 GOOGLE 桌面介绍4.1.1 Google 桌面的功能4.1.2 Google 桌面的补充工具栏4.1.3 使用Google 桌面搜索计算机4.1.4 Google 桌面的高级搜索功能4.1.5 Google 桌面的搜索结果4.1.6 自定义Google 桌面4.2 GOOGLE DESKTOP SDK 基本描述4.3 GOOGLE DESKTOP SDK INDEX API4.3.1 Google 桌面索引插件的开发流程4.3.2 Event 概要4.3.3 注册索引组件4.3.4 创建并发送Event4.3.5 处理Google 桌面 Crawler Notifications4.3.6 使用Visual Studio.NET 开发Google 桌面索引插件4.4 GOOGLE DESKTOP SDK QUERY API4.4.1 注册查询cookie4.4.2 查询对象4.4.3 扩展查询对象4.4.4 结果对象4.4.5 HTTP/XML 查询方式4.5 本章小结5 基于GOOGLE DESKTOP 的教育资源库全文检索系统开发5.1 基于GOOGLE DESKTOP 的教育资源库全文检索系统总体架构5.1.1 Google Desktop Search 的特征5.1.2 检索系统的架构5.2 全文检索系统的设计与开发5.2.1 索引插件的设计开发5.2.2 检索应用的设计开发5.2.3 使用代理5.2.4 使用独立的搜索程序5.3 本章小结6 结论与展望6.1 研究工作总结6.2 主要工作与贡献6.3 进一步的工作与展望参考文献致谢在学期间公开发表论文情况
相关论文文献
标签:教育资源论文; 全文检索论文; 索引论文;
基于Google Desktop的教育资源库全文检索系统研究
下载Doc文档