
论文摘要
电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但垃圾邮件问题也日益严峻,网民平均收到的垃圾邮件数量已经超过了正常邮件。反垃圾邮件技术已经成为了全球所关注的热点。其中基于内容的反垃圾邮件过滤技术更是研究的重点。贝叶斯邮件过滤器具有较强的分类能力,极高的准确率,占据了内容过滤领域的主导地位。但是在实际的应用中,垃圾邮件的特征是不断变化的,而传统的贝叶斯邮件过滤器往往不能反映这种变化。因此,贝叶斯邮件过滤器必须和一种动态适应、记忆性能很好的过滤方法结合起来过滤隐蔽性、变异能力日愈增强的垃圾邮件。人工免疫系统具备强大的自学习、自适应、健壮性等能力,已发展成为计算智能研究的一个崭新的分支。基于此,本文在分析贝叶斯的基本原理和人工免疫的仿生机理的基础上,将贝叶斯与人工免疫相结合,设计了一个基于贝叶斯和人工免疫的垃圾邮件组合过滤算法,并运用于垃圾邮件过滤系统中。具体的说,本文的工作主要包含下列内容:(1)概述了垃圾邮件的定义、危害,国内外垃圾邮件过滤问题的研究现状和发展趋势。(2)分析了贝叶斯和人工免疫系统的基本原理。给出了基本的贝叶斯公式,研究了几个贝叶斯模型,分析了人工免疫系统的仿生机理,及其常用的免疫算法。(3)设计了一个基于贝叶斯和人工免疫的垃圾邮件组合过滤算法。(4)设计了一个基于贝叶斯和人工免疫的垃圾邮件混合过滤系统,并分别在中、英文语料集上做了对比测试及分析,取得了较好的效果。
论文目录
摘要ABSTRACT第一章 引言1.1 垃圾邮件及其危害1.2 国内外垃圾邮件过滤技术的研究现状和发展趋势1.3 论文的目的和意义1.4 论文主要工作和创新点1.5 论文的章节安排第二章 相关过滤技术介绍2.1 贝叶斯理论简介2.1.1 贝叶斯基础理论2.1.2 几种贝叶斯网络模型2.1.3 朴素贝叶斯文本分类算法2.2 人工免疫系统简介2.2.1 人工免疫系统仿生机理2.2.2 免疫算法2.2.3 人工免疫原理对邮件过滤技术的启示2.3 小结第三章 基于贝叶斯和人工免疫的垃圾邮件组合过滤算法研究3.1 算法的提出3.2 算法的基本思想3.3 算法的机制设计3.3.1 邮件预处理3.3.2 邮件判别3.3.3 抗体更新3.4 算法具体流程3.5 小结第四章 垃圾邮件混合过滤系统设计与实现4.1 系统背景4.2 系统设计4.3 系统实现4.3.1 自我/非自我4.3.2 抗体/抗原4.3.3 亲合力的定义和计算4.3.4 记忆细胞4.3.5 克隆选择4.3.6 抗体变异4.4 小结第五章 测试及分析5.1 测试环境5.1.1 软/硬件配置清单5.1.2 测试工具5.2 测试语料库5.2.1 英文语料库5.2.2 中文语料库5.3 评价体系5.4 系统参数对测试结果的影响5.4.1 未成熟细胞集合抗体数量对测试结果的影响5.4.2 记忆细胞集合细胞数量对测试结果的影响5.4.3 阈值对测试结果的影响5.4.4 算法比较5.5 小结第六章 总结6.1 总结6.2 下一步工作及展望致谢参考文献攻硕期间取得的研究成果
相关论文文献
标签:垃圾邮件论文; 邮件过滤论文; 贝叶斯过滤器论文; 人工免疫系统论文;