贝叶斯数据挖掘算法在反垃圾邮件中的研究
论文摘要
目前,解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤方法是一个较为重要的方面,也是当前解决垃圾邮件问题的主流技术之一,它主要包括基于规则的方法和基于贝叶斯方法两个方向。文中重点介绍了朴素贝叶斯垃圾邮件分类模型,并在此基础上提出了一种新的垃圾邮件分类方法—贝叶斯参数估计邮件分类方法。通过采用基于朴素贝叶斯方法和基于贝叶斯参数估计方法两种方法进行邮件过滤对比试验,最终得出结论认为:基于贝叶斯参数估计方法是一种更有效的垃圾邮件过滤方法,新方法与朴素贝叶斯邮件过滤方法相比具有更高的准确性。
论文目录
摘要Abstract1 绪论1.1 垃圾邮件发展历史1.2 垃圾邮件泛滥的原因及危害1.3 垃圾邮件现状2 知识发现中分类问题2.1 KDD 的定义及研究现状2.2 KDD 的主要任务2.3 KDD 的分类问题2.3.1 分类问题的定义2.3.2 几种主要的分类模型2.4 小结3 反垃圾邮件技术描述3.1 IP 层的反垃圾邮件技术3.2 SMTP 层的反垃圾邮件技术3.3 基于内容过滤技术3.3.1 基于规则的方法3.3.2 基于统计的方法3.4 垃圾邮件内容过滤中常用的语料库3.4.1 PU 系列语料3.4.2 Ling-Spam 语料3.4.3 其它语料3.5 评价体系3.6 小结4 反垃圾邮件中贝叶斯技术应用研究4.1 贝叶斯理论4.1.1 贝叶斯概述4.1.2 贝叶斯定义及相关概念4.2 贝叶斯网络模型(BAYESIAN NETWORKS,BNS)4.2.1 朴素贝叶斯分类模型(NBC)及其提升(BoostedNBC)4.2.2 半朴素贝叶斯分类模型(SNBC)4.2.3 树扩展朴素贝叶斯网络分类器及其变化模型4.2.4 增量贝叶斯分类模型4.3 基于朴素贝叶斯方法的反垃圾邮件模型的设计4.4 阈值4.5 小结5 贝叶斯参数估计在反垃圾邮件中的应用5.1 贝叶斯网络学习5.2 贝叶斯估计原理5.3 基于贝叶斯参数估计的反垃圾邮件模型设计5.4 邮件过滤试验结果与比较5.5 小结6 结论攻读硕士学位期间发表的论文致谢参考文献
相关论文文献
本文来源: https://www.lw50.cn/article/e043c7b7ff94500a60a12fa0.html