论文摘要
随着Internet的普及,电子邮件以其方便、快捷、低成本的特点成为现代社会主要通讯工具之一和互联网上最重要、最普及的应用之一。与此同时,垃圾邮件也越来越泛滥,大量占用了互联网上有限的存储、计算和网络资源,降低了网络使用效率,耗费了用户大量的处理时间。因此,研究高效的垃圾邮件过滤技术具有重要的意义。论文对基于行为模式分类的反垃圾邮件技术进行了研究,提出了一个基于行为识别的多层次的垃圾邮件过滤模型,并将其应用到企业邮件过滤项目中。基于行为识别的垃圾邮件过滤技术跳出了传统的基于内容匹配过滤的技术局限,它通过挖掘和利用邮件发送和接收过程中所表现出的各种关键行为特征,形成行为特征模型,进而进行基于行为的识别。这一技术达到了判断准则与邮件内容的无关性,与语言的无关性,从而进一步保证了基于行为过滤的稳定性和用户的隐私权。论文的主要工作和贡献:1.挖掘邮件会话过程中所表现出的行为特征,提出了基于邮件传输代理的垃圾邮件行为识别模型。它不需要接收整封邮件,将垃圾邮件过滤提前到会话阶段。2.挖掘正常用户行为特征,提出了基于邮件投递代理的垃圾邮件行为识别模型。由于行为特征相对邮件内容模式的变化几乎是固定的,所以它优于基于邮件投递代理的其它过滤方法,稳定性更好。3.挖掘正常用户邮件发送行为,提出了基于发送的邮件用户代理垃圾邮件发送行为过滤模型。它在邮件正式发送之前在客户端对其进行判断,节省了网络资源,它既抑制了不良发送者基于正常邮件客户端发送垃圾邮件,同时也抑制受控帐号在不知情的情况下成为垃圾邮件发送者的帮凶。4.分析正常用户接收行为特征,提出了基于接收的邮件用户代理行为过滤模型。用户可以进行个性化的规则设置,从而有针对性的在用户客户端对垃圾邮件进行进一步的识别。5.将基于行为模式分类的反垃圾邮件技术应用到企业信息化中的邮件系统,形成信息综合管理平台。