论文摘要
随着公安信息化的快速发展,公安机关各部门利用计算机采集、处理和积累的情报信息量日益庞大,为使广大警员能在海量的情报内容中快速地搜索到有价值的信息资源,有必要将全文检索技术应用于公安情报信息管理,实现公安机关内部的知识共享。本文介绍了信息检索的相关理论和关键技术,对信息抽取和中文分词技术在公安情报共享中的应用进行了较深入的实践,介绍了全文检索引擎工具包Lucene,研究了其结构、关键数据流和应用逻辑。本文分析了公安机关现有情报共享机制的不足,提出了建立公安共享情报全文数据库来解决内部知识共享的问题;本文设计并实现了一个公安情报共享系统,分析了系统需求,介绍了系统的设计框架和主要组成模块的实现技术,包括文件处理器、索引器和检索器等内容;本文实现的文件处理器能对公安机关目前常用格式的情报资源进行文本抽取,最终转换成建立全文索引所需要的固定结构;本文对中文分词工具JE-Analysis进行了分析,并对其在公安行业的专业应用进行了深入实践;为提高用户查询需求的有效性,本文提出对查询条件进行概念扩展,有效提高了信息检索的查全率和查准率。通过公安情报共享系统的设计与实现,在公安机关内部提供了一个按需检索的共享平台,使被授权的警员能在海量的、非结构化的情报内容中快速地搜索到所关心的信息,将零散片段的情报变成有机的整体,充分发挥了情报信息在引领实战和预警监测方面的重要作用。