一种垃圾邮件混合过滤技术研究

一种垃圾邮件混合过滤技术研究

论文摘要

电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但垃圾邮件问题也日益严峻,网民平均收到的垃圾邮件数量已经超过了正常邮件。反垃圾邮件技术已经成为了全球所关注的热点。其中基于内容的反垃圾邮件过滤技术更是研究的重点。贝叶斯邮件过滤器具有较强的分类能力,极高的准确率,占据了内容过滤领域的主导地位。但是在实际的应用中,垃圾邮件的特征是不断变化的,而传统的贝叶斯邮件过滤器往往不能反映这种变化。因此,贝叶斯邮件过滤器必须和一种动态适应、记忆性能很好的过滤方法结合起来过滤隐蔽性、变异能力日愈增强的垃圾邮件。人工免疫系统具备强大的自学习、自适应、健壮性等能力,已发展成为计算智能研究的一个崭新的分支。基于此,本文在分析贝叶斯的基本原理和人工免疫的仿生机理的基础上,将贝叶斯与人工免疫相结合,设计了一个基于贝叶斯和人工免疫的垃圾邮件组合过滤算法,并运用于垃圾邮件过滤系统中。具体的说,本文的工作主要包含下列内容:(1)概述了垃圾邮件的定义、危害,国内外垃圾邮件过滤问题的研究现状和发展趋势。(2)分析了贝叶斯和人工免疫系统的基本原理。给出了基本的贝叶斯公式,研究了几个贝叶斯模型,分析了人工免疫系统的仿生机理,及其常用的免疫算法。(3)设计了一个基于贝叶斯和人工免疫的垃圾邮件组合过滤算法。(4)设计了一个基于贝叶斯和人工免疫的垃圾邮件混合过滤系统,并分别在中、英文语料集上做了对比测试及分析,取得了较好的效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 垃圾邮件及其危害
  • 1.2 国内外垃圾邮件过滤技术的研究现状和发展趋势
  • 1.3 论文的目的和意义
  • 1.4 论文主要工作和创新点
  • 1.5 论文的章节安排
  • 第二章 相关过滤技术介绍
  • 2.1 贝叶斯理论简介
  • 2.1.1 贝叶斯基础理论
  • 2.1.2 几种贝叶斯网络模型
  • 2.1.3 朴素贝叶斯文本分类算法
  • 2.2 人工免疫系统简介
  • 2.2.1 人工免疫系统仿生机理
  • 2.2.2 免疫算法
  • 2.2.3 人工免疫原理对邮件过滤技术的启示
  • 2.3 小结
  • 第三章 基于贝叶斯和人工免疫的垃圾邮件组合过滤算法研究
  • 3.1 算法的提出
  • 3.2 算法的基本思想
  • 3.3 算法的机制设计
  • 3.3.1 邮件预处理
  • 3.3.2 邮件判别
  • 3.3.3 抗体更新
  • 3.4 算法具体流程
  • 3.5 小结
  • 第四章 垃圾邮件混合过滤系统设计与实现
  • 4.1 系统背景
  • 4.2 系统设计
  • 4.3 系统实现
  • 4.3.1 自我/非自我
  • 4.3.2 抗体/抗原
  • 4.3.3 亲合力的定义和计算
  • 4.3.4 记忆细胞
  • 4.3.5 克隆选择
  • 4.3.6 抗体变异
  • 4.4 小结
  • 第五章 测试及分析
  • 5.1 测试环境
  • 5.1.1 软/硬件配置清单
  • 5.1.2 测试工具
  • 5.2 测试语料库
  • 5.2.1 英文语料库
  • 5.2.2 中文语料库
  • 5.3 评价体系
  • 5.4 系统参数对测试结果的影响
  • 5.4.1 未成熟细胞集合抗体数量对测试结果的影响
  • 5.4.2 记忆细胞集合细胞数量对测试结果的影响
  • 5.4.3 阈值对测试结果的影响
  • 5.4.4 算法比较
  • 5.5 小结
  • 第六章 总结
  • 6.1 总结
  • 6.2 下一步工作及展望
  • 致谢
  • 参考文献
  • 攻硕期间取得的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    一种垃圾邮件混合过滤技术研究
    下载Doc文档

    猜你喜欢