贝叶斯数据挖掘算法在反垃圾邮件中的研究

贝叶斯数据挖掘算法在反垃圾邮件中的研究

论文摘要

目前,解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤方法是一个较为重要的方面,也是当前解决垃圾邮件问题的主流技术之一,它主要包括基于规则的方法和基于贝叶斯方法两个方向。文中重点介绍了朴素贝叶斯垃圾邮件分类模型,并在此基础上提出了一种新的垃圾邮件分类方法—贝叶斯参数估计邮件分类方法。通过采用基于朴素贝叶斯方法和基于贝叶斯参数估计方法两种方法进行邮件过滤对比试验,最终得出结论认为:基于贝叶斯参数估计方法是一种更有效的垃圾邮件过滤方法,新方法与朴素贝叶斯邮件过滤方法相比具有更高的准确性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 垃圾邮件发展历史
  • 1.2 垃圾邮件泛滥的原因及危害
  • 1.3 垃圾邮件现状
  • 2 知识发现中分类问题
  • 2.1 KDD 的定义及研究现状
  • 2.2 KDD 的主要任务
  • 2.3 KDD 的分类问题
  • 2.3.1 分类问题的定义
  • 2.3.2 几种主要的分类模型
  • 2.4 小结
  • 3 反垃圾邮件技术描述
  • 3.1 IP 层的反垃圾邮件技术
  • 3.2 SMTP 层的反垃圾邮件技术
  • 3.3 基于内容过滤技术
  • 3.3.1 基于规则的方法
  • 3.3.2 基于统计的方法
  • 3.4 垃圾邮件内容过滤中常用的语料库
  • 3.4.1 PU 系列语料
  • 3.4.2 Ling-Spam 语料
  • 3.4.3 其它语料
  • 3.5 评价体系
  • 3.6 小结
  • 4 反垃圾邮件中贝叶斯技术应用研究
  • 4.1 贝叶斯理论
  • 4.1.1 贝叶斯概述
  • 4.1.2 贝叶斯定义及相关概念
  • 4.2 贝叶斯网络模型(BAYESIAN NETWORKS,BNS)
  • 4.2.1 朴素贝叶斯分类模型(NBC)及其提升(BoostedNBC)
  • 4.2.2 半朴素贝叶斯分类模型(SNBC)
  • 4.2.3 树扩展朴素贝叶斯网络分类器及其变化模型
  • 4.2.4 增量贝叶斯分类模型
  • 4.3 基于朴素贝叶斯方法的反垃圾邮件模型的设计
  • 4.4 阈值
  • 4.5 小结
  • 5 贝叶斯参数估计在反垃圾邮件中的应用
  • 5.1 贝叶斯网络学习
  • 5.2 贝叶斯估计原理
  • 5.3 基于贝叶斯参数估计的反垃圾邮件模型设计
  • 5.4 邮件过滤试验结果与比较
  • 5.5 小结
  • 6 结论
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    贝叶斯数据挖掘算法在反垃圾邮件中的研究
    下载Doc文档

    猜你喜欢