论文摘要
教育资源的共享技术已经成为现代网络教育技术领域的热点。而如何准确定位和检索到消费者所需要的教育资源是当今信息检索技术研究的关键。首先,本文探讨了倒排索引、索引构造和维护、索引压缩存储和检索算法等关键技术。对检索算法进行改进,采用跳跃指针来减少扫描记录的次数,从而加快检索速度。其次,针对关系数据库对非结构化数据索引和检索速度慢的问题,提出了全文数据库和关系数据库相结合的数据库设计方案,提高了数据索引和检索性能,实现了对资源和索引库的有效管理。最后,以Lucene全文检索技术框架为基础,根据教育资源共享的实际需要,设计了全文检索的技术架构和系统模型,实现教育资源的定义和分类、数据的加工和处理、索引的建立、全文数据的检索等主要功能模块,同时对检索结果进行评分排序,实现了具有检索、浏览和下载功能的教育资源全文检索子系统。实验结果表明索引和检索性能达到了系统的设计要求。
论文目录
摘要Abstract第一章 绪论1.1 课题研究背景、来源及现状1.1.1 课题研究背景及来源1.1.2 全文信息检索技术现状1.2 信息检索技术面临的挑战1.3 本文主要研究内容和工作1.4 本文的组织第二章 教育资源共享体系结构分析与设计2.1 教育信息资源定义和分类2.2 教育资源共享系统体系结构第三章Lucene 全文检索技术研究3.1 Lucene 数据源解析与索引3.1.1 数据源解析3.1.2 索引的建立与全文检索3.2 中文切词解决方案3.2.1 中文信息检索算法3.2.2 检索词首字直接匹配算法第四章 全文检索关键技术与检索算法改进4.1 索引构造算法研究4.1.1 传统倒排索引4.1.2 索引构造算法和索引维护4.1.3 索引压缩存储算法研究4.2 检索算法的改进和结果排序4.2.1 Lucene 检索算法及其改进4.2.2 相似度计算和结果排序第五章 基于文件系统的全文数据库设计5.1 全文数据库功能设计5.2 关系数据库系统弊端研究5.3 基于文件系统的构建方案第六章 教育资源全文检索系统设计与实现6.1 系统概述6.1.1 系统简介6.1.2 系统实现目标6.2 全文检索系统总体设计6.2.1 全文检索系统的体系结构6.2.2 系统实现平台及开发工具6.3 全文数据库实现6.3.1 文本数据库的建立6.3.2 索引库的建立6.3.3 关系数据库后台管理实现6.4 数据加工及文本数据的实现6.5 全文数据索引与性能测试6.6 全文数据检索6.7 结果处理与检索性能测试6.7.1 检索结果评分和排序6.7.2 运行结果6.7.3 检索性能测试对比与分析第七章 总结和展望7.1 对本文工作的总结7.2 未来研究展望致谢参考文献读研期间研究成果
相关论文文献
标签:资源共享论文; 全文检索论文; 倒排索引论文; 全文数据库论文;