论文摘要
军用文书包括平时文书和作战文书,是军队各级领导机关行使职能,实施指挥和管理部队的重要工具和基本手段。作为军队机关公文,在指挥员和指挥机关联贯、控制指挥对象,指挥本级训练、劳动、操课及作战行动等活动中起着衔接作用,而文书本身也直接影响到将机关的信息发布、管理、服务、与下级沟通、向上级请示汇报、平级之间协调的功能。随着计算机和信息技术的迅速发展,军用文书信息量正以指数规律迅猛增长,军队办公网已经成为军用文书最重要的海量信源,如何找到相应的军用文书己经成为人们获取信息资源日益严重的问题。研究了基于Lucene的军用文书检索系统,首先介绍了全文检索引擎,阐述了其产生和发展、系统结构,对搜索引擎的搜索、索引和检索及其技术进行了深入研究,对全文检索系统的构建和使用进行了深入分析。然后对Apahce全文检索系统Lucene源码的剖析和实践,重点研究了Lucene的系统组织结构、系统特点、数据流以及索引数据库的文件结构。对Lucene的重要包进行了分析,深刻理解其搜索过程以及搜索方式。提出了基于Lucene的军用文书检索系统的关键技术,对文档的分析技术进行了剖析,研究了中文分词技术,提出了系统的索引过程,重点研究了索引数据结构和索引的组织方式,研究了系统的检索技术,对典型的检索技术进行了分析。通过对军用文书搜索引擎主要技术的研究,设计并实现了一个军用文书信息搜索引擎系统。分析了系统的需求,提出了系统框架和结构。对各子系统如信息搜索子系统、索引子系统、搜索子系统和页面去重子系统进行了详细设计和实现,并给出了一部分实现代码。基于Lucene的军用文书检索系统具有良好的扩展性,不仅适用于通用搜索引擎系统,而且适用于目前广泛使用的专业文献检索系统。