论文摘要
随着计算机网络的迅猛发展,许多企业和学校都能够通过企业内部网(校园网)迅速获取所需信息。但是这些信息中含有一些非法的、反动的以及不良的信息。为了实时监控和过滤这些信息,就需要在局域网中建立信息过滤系统。 在局域网中,已有的信息过滤系统如防火墙过滤和在个人机器上的过滤系统,由于对用户上网速度会产生限制,不适应现有的需求。因此产生了基于旁路方式获取网络日志,并进行信息过滤的系统。本文主要是研究如何过滤一个企业内部网(校园网)和Internet连接边界的主要的信息流,并对于网络上的文本信息进行实时过滤和监控。 本论文以作者参与开发的基于网络日志的信息过滤系统在企业内部网(校园网)的应用为背景,首先介绍了信息过滤的定义、分类和特点以及信息过滤系统的基本模型和目前常用的信息过滤系统;其次,本文介绍了对于内容过滤常用的信息获取模型。接下来,本论文重点介绍了在信息过滤中主要使用的包过滤和内容过滤,并描述了信息过滤系统的设计与实现。最后,本论文分析了此信息过滤系统存在的缺陷,并提出相应的改进的信息过滤系统的体系结构模型及设计。